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UTILISATION DES PRODUITS DES GENES DE LA FAMILLE 2'-5' 
OLIGOADENYLATE SYNTHETASE (OAS) POUR LE CRIBLAGE 
D'ANTIVIRAUX ET LA DETECTION DE LA SENSIBILITE A 
L INFECTION PAR LES FLAVIVIRIDAE. 

La presente invention est relative a I'utilisation des produits des 
genes de la famille T-5' oligoadenylate synthetase (OAS) pour le criblage 
d'antiviraux et la detection de la sensibilite a Tinfection par les Flaviviridae. 

La famille des Flaviviridae regroupe les virus du genre flavivirus 
responsables de pathologies humaines graves telles que la dengue, la fievre jaune, les 
encephalites transmises par les tiques. I'encephalite japonaise, Tencephalite a West- 
Nile et les virus des hepatites C et G. Si les flavivirus sont susceptibles de provoquer 
une morbidite et une mortalite importantes chez Fhomme, Tinfection est generalement 
asymptomatique et seule une fraction des individus infectes developpent une maladie 
grave. 

Les flavivirus sont des petits virus enveloppes. Leur genome est une 
molecule d ? ARN monocatenaire de polarite positive d'environ 1 1 000 bases. V ARN 
genomique est associe a plusieurs copies de la proteine de capside C pour former la 
nucleocapside; elle est entouree d'une enveloppe virale constitute d'une double couche 
lipidique issue des membranes du reticulum endoplasmique (RE) dans lesquelles sont 
ancrees la proteine d'enveloppe E et la proteine de membrane M L'ARN genomique 
des flavivirus contient un unique cadre de lecture ouvert d'environ 10500 nucleotides 
flanque de deux courtes regions non codantes a ses extremites 5' et 3'. Le genome est 
traduit en une polyproteine d'environ 3400 acides amines qui est le precurseur des 
proteines structurales C. prM (le precurseur intracellulaire de M) et E dans sa partie N- 
terminale et d*au moins sept proteines non structurales (NS) de NS1 a NS5 dans sa 
partie C-terminale. 

De nombreux facteurs semblent intervenir dans la reaction d'un sujet 
a une infection virale : des facteurs viraux pourraient etre responsables de la severite 
de la maladie. alors que la constitution genetique de Phote (humain ou mammifere 
non-humain) contribuerait a la sensibilite ou a la resistance a Tinfection. 

Des modeles murins ont permis d'etabltr ['existence d'une resistance 
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genetique a ('infection par les flavivirus. II a ete montre que certaines lignees de souris 
recemment derivees de Petat sauvage et appartenant aux especes Mus musculus 
musculus ou Mus spretus (Det. BSVR, BRVR, PR], CASA/Rk et CAST/Ei) sont 
resistantes a Pinfection par les Flavivirus, alors que les lignees consanguines de labo- 
ratoire les plus courantes qui derivent majoritairement de Pespece Mus musculus 
domestic us . n'y resistent pas(Sangster etaL. J.Virol., 1993, 67 : 340-347). 

La resistance est controlee par au moins un locus autosomal 
denomme Flv, localise sur le chromosome 5, chez la souris et trois alleles Flv 5 , Flv r et 
Flv mr conferent respectivement la sensibilite, la resistance et la resistance 
intermediaire a Pinfection par les flavivirus. En utilisant une souche du flavivirus de 
Pencephalite de la Vallee de Murray et des souris issues du croisement retour de la 
lignee de souris resistante C3H/RV avec les lignees de souris sensibles C3/He ou 
BALB/c 5 le locus Flv a ete localise dans une region de 0.9 cM du chromosome 5, chez 
la souris, entre les marqueurs D5MU68 et D5MU242 (G.R. Shellam et al., Rev. Sci. 
Tech. Off. Epiz. 1998.17 :23 1-248.). 

En depit de 1'existence de ces modeles murins de resistance geneti- 
que a I' infection par les flavivirus, aucun gene cellulaire de mammifere implique dans 
la resistance a I* infection par les Fluviviridae n ? a encore ete identifie, de maniere 
certaine au niveau moleculaire. C'est pourquoi les Inventeurs se sont donnes pour but 
de pourvoir a des outils. aptes a permettre d'evaluer la sensibilite de l'hote (humain ou 
mammifere non-humain) dans certaines infections virales particulierement graves pour 
Phomme comme celles provoquees par les Flaviviridae. 

En utilisant un modele experimental mettant en oeuvre une nouvelle 
souche neurovirulente et neuroinvasive du virus West-Nile particulierement virulente, 
dont le genome presente la sequence SEQ ID NO: L et denommee ci-apres souche IS- 
98-ST1, et des lignees de souris resistantes derivant de geniteurs sauvages appartenant 
a I'espece Mus musculus musculus ou Mus spretus, croisees en retour avec les lignees 
sensibles de laboratoire BALB/c ou C57BL/6, les Inventeurs ont precise la localisation 
du locus Flv dans un interval le de 0,2 a 0,4 cM du chromosome 5 de souris, com- 
prenant la famille des genes 2 , -5' oligoadenylate synthetase (OAS) et ils ont montre 
que c'est le gene OAS qui confere la resistance a Pinfection par les Flaviviridae. Trois 



0 



WO 02/081741 




PCT; 



169 



3 



iso formes de TO AS -LI. L2 et L3- ont ete decrites chez la souris (Genbank Data 
Library n° X55982 [LI]. X58077 [2] et M33863 [L3]). Leurs genes presentent une 
forte homologie de sequence (plus de 80 %) (figure 1) avec ceiui de l'OAS p40/p46 
humain (Genbank Data Library n° XM-007004 et XM-007005) (figure 2). On ne dis- 
pose que de peu d'informations sur les formes LK L2 et L3 de l'OAS murin. 



L participe a la defense de I'hote contre une infection virale (Castelli et al., Biomed. 
And Pharmacother.. 1998, 52. 386-390). Le systeme 2-5 A est une voie de degradation 
des ARNs intracellulaire (pour revue, Rutherford et aL N.A.R.,1991, 9, 1917-1924). 
L'expression des genes OAS est induite par les interferons (IFN). Les IFNs appartien- 
nent a un groupe de cytokines qui induisent un etat anti-viral dans beaucoup de lignees 
cellulaires (Goodbourn et aL J. Gene Virol., 2000, 81, 2341-2364). Les deux isofor- 
mes cc/p composent les IFNs de type I : ils se fixent sur le meme recepteur et provo- 
quent des repohses similaires chez I'hote. Les phagocytes mononuclees et les fibro- 
blastes sont respectivement les principaux producteurs d'IFN-a et d'IFN-P mais 
certains types cellulaires peuvent produire les deux isoformes. L'infection viraJe d'une 
cellule hote induit la production de 1'IFN ct/p qui par fixation sur les recepteurs kinases 
a tyrosine, presents a la surface cellulaire des cellules avoisinantes non infectees, va 
induire l'expression de ptusieurs especes proteiques qui seront determinants dans les 
defenses anti-virales. Une perte de l'homeostasie calcique des cellules neuronales, 
notamment chez le rat. est aussi capable d'induire ['expression des genes de la famille 
OAS (Paschen et aL Neuroscience Letters, 1999, 263, 109-1 12). II a aussi ete montre 
que la proteine C du virus de Phepatite C active le promoteur de l'OAS p40/p46 chez 
rhomme (Naganuma et aL J. ViroL, 2000, 74, 8744-8750). 



interagissant avec une molecule d'ARN bicatenaire. L'OAS active va alors polymeriser 
l'ATP en oligomeres ppp[A2'p]nA[2-5A] qui vont interagir de fa<;on allosterique avec 
la forme normalement latente de la RNase L (84 kda) pour I'activer. Le site catalytique 
de la RNase L est localise dans sa region carboxy-terminale et des sequence repetees 
de type ankyrine. une region d'homologie aux proteines kinases et un domaine qui est 



Le systeme 2-5A qui implique la famille des genes OAS et la RNase 



La molecule OAS produite sous une forme latente devient active en 
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predit former un doigt de zinc sont aussi retrouves. La ribonuclease active degrade les 
ARN monocatenaires en les clivant au niveau des motifs riches en UA et UU. 

Au cours d'une infection virale, la RNase L clive les ARN cellulaires 
de types messagers et ribosomaux comme les ARN viraux monocatenaires, bloquant 
ainsi la progression du cycle replicatif du virus. La RNase L joue aussi un role dans la 
regulation de I'expression des genes des facteurs pro-apoptotiques tels que Box et les 
caspases (Castelli et uL Cell Death and Differentiation, 1998, 5, 313-320 ; Rush et a/., 
J. Interferon Cytokine Res.,2000, 20. 1091-1 100). 

Des facteurs capables de reguler la voie OAS ont ete mis en evi- 
dence. Un inhibiteur de la RNase L murine a ete identifie, RNase I. Cet inhibiteur a ete 
montre moduler la repression du gene MyoD, un facteur de transcription specifique 
aux cellules musculaires (Bisbal et al y Mol. Cell Biol., 2000, 20, 4959-4969). La 
RNase I est aussi induite par le HIV de type 1 et participe ainsi a la diminution de la 
reponse antivirale de la cellule (Martinand et a/., J. Virol., 1999, 73, 290-296). 

Trois domaines conserves ont ete identifies dans la 2'-5'- oligoade- 
nylate synthetase : une boucle P suivie d'une sequence riche en asparagine denommee 
boite D et une region riche en lysine et en arginine denommee region KR. Des mutants 
ponctuels de Tun de ces trois domaines de Fisoforme LI murine (boucle P : : K67R, 
K67M, G62A et G63A ; boite D : D76N et D78N ; domaine KR : K200R et K200M) 
ont une activite enzymatique tres reduite ou completement abolie (Yamamoto et aL, J. 
Interferon Cytokine Res., 2000, 20 : 337-344). 

Les Inventeurs ont mis en evidence des mutations dans la sequence 
nucleotidique des genes OAS chez les souris sensibles a ('infection par les Flaviviri- 
dae ; ces mutations inactivent le gene OAS. 

Ces elements ont conduit les Inventeurs a mettre au point un modele 
adapte au criblage de molecules aptes a stimuler specifiquement 1'activite des genes 
OAS et/ou a la detection des sujets sensibles a une infection par les virus de la famille 
des Flaviviriciue et de ce fait mauvais repondeurs a un traitement a l'interferon ; la 
mesure de 1'activite 2*o ? OAS chez un individu ou un groupe d'individus representa- 
tifs d'une population humaine permet d'evaluer le risque pour cet individu ou cette 
population a developper une forme grave de la maladie (forme aigue mortelle pour les 
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arboviroses ou forme chronique pour Phepatite C). 

En consequence, la presente invention a pour objet un procede de 
criblage de molecules aptes a stimuler un gene de la famille OAS, caracterise en ce 
qu'il comprend : 

• la mise en culture de cellules, issues d'un mammifere non-humain 
FW/Flv r ou F/v7F/v\ 

- I* induction de P expression des genes OAS, par addition 
d' interferon a ou P ou par un stress calcique, notamment par addition d'EGTA, 

- la mise en contact desdites cellules avec la molecule a cribler, et 

- la mesure de Pactivite d'un gene OAS, par comparaison avec un 
echantillon temoin. 

Ledit echantillon temoin est notamment constitue par des cellules de 
mammiferes non-humain Flv s /Flv s . 

Selon un mode de mise en oeuvre avantageux dudit procede, ledit 
mammifere non humain FW/Flv est de preference une lignee de souris resistantes 
derivant de geniteurs sauvages appartenant a Pespece Mm musculus musculus, ou Mus 
spretus ; elles peuvent de maniere encore plus preferee etre croisees en retour avec des 
lignees murines sensibles de laboratoire telles que BALB/c ou C57BL/6, de fagon a 
obtenir des lignees dites congeniques. 

Ces lignees pourront etre utilisees dans de multiples experiences 
destinees a analyser les mecanismes de defense de la souris contre les infections vira- 
les a flavivirus et notamment pour l'analyse de la physiopathogenie de Tinfection au 
niveau cellulaire. Elles pourront aussi servir a la mise au point de therapeutiques d'un 
genre nouveau, lorsque les experiences en question necessiteront Tutilisation de lots 
homogenes d'animaux ayant tous la meme constitution genetique, afin de comparer 
leur comportement apres infection ou non. Ces animaux, qui par definition seront 
histocompatibles entre eux et avec Tautre congenique permettront de realiser, si besoin 
est, des transferts cellulaires. 

Selon un autre mode de mise en oeuvre avantageux dudit procede, 
ledit gene OAS est un gene autologue. 

Selon un autre mode de mise en oeuvre avantageux dudit procede, 
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ledit gene OAS est un gene heterologue. 

Selon un autre mode de mise en oeuvre avantageux dudit procede, 
I'activite du gene OAS peut-etre mesuree par determination : 

- de la quantite de transcrits OAS par des techniques classiques qui 
en elles-memes sont connues de Fhomme du metier (Northern-blot, RT-PCR...), 

- de la quantite de proteines 2* -5' OAS produites, par des techniques 
classiques qui en elles-memes sont connues de Thomme du metier (ELISA, R1A, 
radioimmunoprecipitation. Western-blot..), 



elles- memes sont connues de l'homme du metier, telles que celles decrites dans Witt 
et al., J. Interferon Res., 1993, 13, 17-23 ou 



genes de la famille OAS : mise en evidence eventuelle de Tune des mutations preci- 
pes. 

La presente invention a egalement pour objet Putilisation des mole- 
cules d'acides nucleiques, selectionnees dans le groupe constitue par : 

a) les molecules d'ADN genomique de mammifere (humain ou non- 
humain) correspondant a un locus de resistance a une infection par un Flaviviridae, 
lesquelles molecules sont constitutes par un fragment de 0,2 a 0,4 cM incluant la 
famille des genes OAS sauvages ou mutes, 



pour le criblage de molecules antivirales destinees au traitement des infections par les 
virus de la famille des Flaviviridae. 



presentant au moins une une substitution, une insertion ou une deletion d'au moins un 
nucleotide d'une region codante ou non-codante, par rapport a la sequence du gene 
sauvage. 

Dans le cas oil les genes OAS sont des genes sauvages, lesdits indi- 
vidus sont resistants a P infection par un Flaviviridae, dans le cas ou les genes OAS 



- du niveau d'activite 2'-5 ? OAS, par des techniques classiques qui en 



- des sequences des ARNm ou de PADN genomique, issues des 



b) les ADNc desdites molecules en a), 

c) les proteines codees par lesdites molecules en a) ou en b), 



Au sens de la presente invention, on entend par "gene mute" un gene 
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sont des genes mutes, ils sont- de preference, inactives ; en consequence, les individus 
porteurs desdites mutations sont sensibles a l'infection par lesdits virus. 

Selon un mode de realisation avantageux de ladite utilisation, 
lesdites molecules sont. de preference, des sequences d'ADN genomique des genes de 
la famille OAS. les ADNc desdites sequences et les proteines correspondantes. 

La presente invention a egalement pour objet une molecule d'ADN 
genomique de mammifere (humain ou non-humain) correspondant a un locus de 
resistance a une infection par un Flaviviridae. caracterisee en ce qu'elle est constitute 
par un fragment de 0.2 a 0.4 cM incluant un gene OAS inactive codant pour une 
proteine presentant au moins une mutation dans la sequence d'ADNc correspondante, 
laquelle mutation est selectionnee dans le groupe constitue par une deletion des 
nucleotides en positions 100 a 102, 221 a 232, 577 a 578 et une insertion d'un codon 
stop en positions 807-809. en reference a la sequence de l'ADNc de risoforme L3 de 
souris (GENBANK M33863. figure 3A a 3C) ; Introduction d'un codon stop 
premature (figure 3B) est responsable de la production d'une proteine 2'-5' OAS 
tronquee inactive, deletee des residus C-terminaux (acides amines 258 a 367, en 
reference a la sequence de 1'isoforme L3 de souris GENBANK AAA371 16, figure 4). 

Les mutations telles que definies ci-dessus sont presentent unique- 
ment chez les souris sensibles a T infection par les Flaviviridae ; elles inactivent le 
gene OAS. 

Selon un mode de realisation avantageux de ladite molecule, elle 
comprend la sequence du marqueur D5MU368 du chromosome 5 de souris. 

La presente invention a egalement pour objet ['utilisation d'un 
vecteur recombinant comprenant une molecule d'acide nucleique telle que definie ci- 
dessus pour le criblage de molecules antivirales destinees au traitement des infections 
par les virus de la famille des Flaviviridae. 

La presente invention a egalement pour objet 1' utilisation de cellules 
contenant un vecteur recombinant comprenant une molecule d'acide nucleique telle 
que definie ci-dessus pour le criblage de molecules antivirales destinees au traitement 
des infections par les virus de la famille des Flaviviridae. 

La presente invention a egalement pour objet l'utilisation d'un 
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mammitere non-humain recombinant comprenant une molecule cTacide nucleique 
telle que definie ci-dessus pour le criblage de molecules antivirales destinees au 
traitement des infections par les virus de la famille des Ftaviviridae. 

La presente invention a egalement pour objet une molecule d'acide 
nucleique constitute par un ADNc ou une sequence d'ADN genomique issue d'un 
gene de la famille OAS comme medicament destine au traitement des infections par 
les virus de la famille des Fhmviridae. 

La presente invention a egalement pour objet une proteine codee par 
un ADNc ou une sequence d'ADN genomique issue d'un gene de la famille OAS 
comme medicament destine au traitement des infections par les virus de la famille des 
Flaviviridae. 

La presente . invention a egalement pour objet un procede 
devaluation de la sensibilite d'un individu a Pinfection par un virus de la famille des 
Flaviviridae et/ou de sa reponse a un traitement par P interferon, caracterise en ce qu'il 
comprend : 

- la mise en culture de cellules a partir d'un echantillon de cellules 

d'un individu, 

- Tinduction de Pexpression des genes OAS par addition 
d' interferon a ou P ou par un stress calcique, notamment par addition d'EGTA, et 

- la mesure de Pactivite d'un des genes OAS, par comparaison avec 
un echantillon de cellules, obtenues a partir d'un sujet temoin resistant a Pinfection. 

L'evaluation est notamment utile pour evaluer la reponse vaccinale, 
en vue de mettre au point des souches attenuees plus efficaces. 

La presente invention a egalement pour objet des reactifs utiles pour 
mettre en ceuvre Tun des procedes tels que definis ci-dessus : criblage, evaluation ou 
detection. 

Parmi ces reactifs, on peut citer : 

- les amorces de sequences SEQ ID NO :5 a SEQ ID NO :22 et 

- les sondes correspondant respectivement aux positions 257-707 du 
transcrit de I'isoforme L3 murine et aux positions 1379-1874 du transcrit de Pisoforme 
L2 murine (SEQ ID NO : 31 -32). 
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L/activite du gene OAS peut-etre mesuree par les techniques telles 
que definies ci-dessus. 

La presente invention a egalement pour objet des cellules eucaryotes 
transformees. caracterisees en ce qu'elles comprennent une molecule d'acide nuclei- 
que de mammifere (humain ou non-humain), telle que definie ci-dessus. 

Lesdites cellules sont, de preference, obtenues par recombinaison 
homologue a Paide d'un vecteur approprie. conformement a la technique decrite dans 
la demande EP 0 419 621 ou le brevet US 5,792 632. 

La presente invention a, egalement pour objet des mammiferes non- 
humains transgeniques, caracterises en ce qu'ils incluent au moins une copie d'une 
molecule d'acide nucleique, telle que definie ci-dessus. 

De maniere preferee, lesdits mammiferes, notamment des souris, 
sont obtenus par injection in ovo (technique classique de Brister et al.) d'une molecule 
d'ADN selon P invention contenant la region OAS provenant de souris sauvages., 
c'est-a-dire resistantes a Pinfection. 

La presente invention a egalement pour objet des mammiferes non- 
humains recombinants, caracterises en ce qu'ils sont porteurs d'au moins un allele du 
gene OAS inactive. 

On obtient par exemple des souris knock-out pour Pensemble des 
genes OAS. par deletion desdits genes par la technique cre-LoxP (voir Demande WO 
97/06271) 

Outre les dispositions qui precedent, P invention comprend encore 
d'autres dispositions, qui ressortiront de la description qui va suivre, qui se refere a 
des exemples de mise en ceuvre de Pobjet de la presente invention, ave references aux 
dessins annexes dans lesquels : 

- la figure 1 illustre la structure de la famille des genes OAS murins, 

- la figure 2 illustre la structure de la famille des genes OAS humains 

- la figure 3 (A. B et C) represente Palignement de la sequence 
nucleotidique de PADNc des genes OAS des souris sensibles a Pinfection par les 
Flaviviriclae (C57BL/6) et du gene OAS1 humain, 

- la figure 4 represente Palignement de la sequence en acides 
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amines des isoformes LI, L2 et L3 de la 2'-5* OAS des souris sensibles a l'infection 
par les Flaviviridae (C57BL/6) et de I'isoforme p40/p46 humaine, 

- les figures 5A a 5E representent la com])araison de la sequence en 
acides amines des proteines virales de la souche IS-98-ST1 (SEQ ID NO: 2) et de la 
souche New York 1 999 (N Y99 : Genbank AF 1 9683 5), 

- la figure 6 represente la cinetique de mortalite et la cinetique 
d'apparition des anticorps seriques specifiques chez les souris Flv s /Flv s (BALB/c) 
infectees par la souche IS-98-ST1 du virus West-Nile (UFF : Unites Formant Foyer), 

- la figure 7 represente la cinetique de propagation de la souche IS- 
98-ST1 dans le systeme nerveux central des souris sensibles (BALB/c), 

- la figure 8 represente le protocole experimental utilise pour preci- 
ser la localisation du locus Flv sur le chromosome 5 de la souris et pour etablir une 
lignee congenique BALB/c Flv r , 

- la figure 9 represente la carte genetique du locus Flv, determinee a 
partir des souris sensibles, issues du premier croisement en retour entre les lignees 
resistantes (MAI/Pas et MBT/Pas) et les lignees sensibles (C57BL/6 ou BALB/c). Les 
cases blanches representent les alleles BALB/c ou C57B1/6 et les cases noires repre- 
sentent les alleles MAI/Pas ou MBT/Pas, 

- la figure 1 0 represente les haplotypes autour du locus Flv determinant 
la sensibilite ou la resistance aux Flaviviridae, issus du premier croisement en retour 
(BC1) entre les lignees resistantes (MAI/Pas et MBT/Pas) et les lignees sensibles 
(C57BL/6 et BALB/c). Les lignes grisees representent les alleles (BALB/c ou 
C57BI/6) et les lignes noires representent les alleles MAI/Pas ou MBT/Pas, 

- la figure 1 1 represente la carte genetique et la carte physique du 
locus Flv et la position du gene OAS dans ce locus, 

- la figure 12 represente la distribution des alleles Flv chez les souris 
resistantes et sensibles issues du premier croisement en retour (BC1) entre les lignees 
resistantes (MAI/Pas et MBT/Pas) et les lignees sensibles (C57BL/6 et BALB/c), 

- la figure 13 represente la carte physique du clone BAC RP23- 
39M18 de souris sensibles (C57BL/6) sur laquelle figure la position des marqueurs de 
type microsatellite et STS ainsi que la position des genes OAS murins, 
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- la figure 14 represente la cinetique d'apparition des antigenes 
viraux dans les cellules Neuro 2a et les neurones primaires de souris sensibles 
(BALB/c) infectees par le virus West-Nile (souche IS-98-ST1), 

- la figure 15 represente la mort par necrose des cellules Neuro 2a 
infectees par le virus West-Nile (souche IS-98-ST1) : m.L multiplicity defection, 

- la figure 16 represente Pactivite antivirale de PIFN-a sur les 
cellules Neuro 2a infectees par la souche IS-98-ST1 du virus West-Nile : UFF, Unites 
Formant Foyer, et 

- la figure 17 represente les amorces utilisees pour la detection des 
mutations dans les sequences codantes de Pisoforme LI des genes OAS des souris 
sensibles C57BL6. 
Exemple 1 : M ateriels et methodes 

1) Souris mises en oeuvre 

- lignees de souris consanguines sensibles Flv 5 IFlv 5 C57BL6 et 
BALB/c (Janvier). 

- lignees de souris resistantes (FlvlFlv), derivees de souris sauvages 
appartenant a Pespece Mus musculus musculus, MAI/Pas (capturees en Autriche dans 
la region d'lllmitz) et MBT/Pas (capturees en Bulgarie dans la region de General 
Toshevo), Mus spretus (SEG/Pas et STF/Pas) et Mus musculus domesticus 
(WMP/Pas) (F. Bonhomme et al., 1996, The laboratory mouse and its wild relatives, 
« Genetics variants and strains of the laboratory mousey S.R.M.F. Lyon, S.D.M. 
Brown, Oxford University Press, Oxford, 1577-1596). 

2) Virus 

a) isolement. amplification, purification et titration 
Le virus West-Nile (WN) a ete obtenu a partir du systeme nerveux 
central d'une cigogne manifestant des troubles neuropathologiques severes en septem- 
bre 1998, a Eilat (Israel). L'infection de cellule VERO par cet isolat est cytolytique et 
rimmunofluorescence indirecte avec un ascite de souris immun specifique du virus 
West-Nile est positive a 100 %. Le virus produit sur cellules VERO a ete recolte et 
amplifie sur cellules de moustiques AP61 Despres et al., Virology, 1993, 196, 209- 
219). 
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Le passage 1 (ou PI) du virus WN sur cellules AP61 a ete recolte 3 
jours apres l infection ; il possede un titre de 2,5 x 10 8 UFF/ml (Unite Formant Foyer) 
par la technique de titration sur cellules AP6I decrite dans Despres et al. (Virology, 
1993, 196, 209-219). L" inoculum PI du virus WN sur cellules AP61 a ete identifie 
comme la souche IS-98-ST1. 

Un P2 a ete obtenu, a partir de cellules AP61 infectees par la souche 
IS-98-STL PI (titre: 6 x 10 7 UFF/ml). L'inoculum P2 de IS-98-ST1 est utilise pour les 
epreuves de sensibilite a 1" infection virale chez les souris adultes. 

Un inoculum viral P3 de la souche IS-98-ST1 avec un titre de 5 x 
10 7 UFF/ml a ete produit sur cellules AP61. Une preparation virale hautement puri- 
fiee, obtenue selon le protocole de purification des flavivirions decrit dans Despres et 
al. (Virology, 1993. 196, 209-219) a ete obtenue a partir de 20 boites de 150 cm 2 de 
cellules AP61 recoltees 3 jours apres I' infection par ('inoculum P3 du virus WN 
souche IS-98-ST1 (multiplicity d'infection de 0,4). La souche IS-98-ST1 purifiee en 
gradient de saccharose a un titre final de 2 x 10 10 UFF/ml. 

Les ARNs extraits de ce virus purifie sont utilises pour amplifier les 
ADNc correspondant aux proteines virales C, prM et NS1 . 
b) Sequenqage de TARN viral 

Le genome viral a ete extrait a partir du surnageant de culture des 
cellules VERO infectees de Pexemple 1 a I'aide du kit ;t QIAamp Viral RNA " 
(QIAGEN), en suivant les instructions du fabricant. 6 produits RT-PCR chevauchants 
ont ete amplifies a partir de ces ARNs en utilisant les amorces decrites par Lanciotti et 
al. (Science, 199, 286 :2333-). Les extremites 5' et 3' du genome viral ont ete ampli- 
fies a Paide d'amorces synthetisees d'apres la sequence de la souche ■ WN-NY99 
(Genbank n° AF202541). Les ADNc obtenus ont ete purifies par chromatographic 
echangeuse d'ions et precipites dans 2 volumes dMsopropanoI. Ensuite les ADNc ont 
ete sequences sur les deux brins en utilisant le kit " Taq Dye Deoxy Terminator Cycle 
Sequencing M (PERKIN ELMER CORP./APPLIED BIOSYSTEM) et les amorces 
espacees de 400 paires de bases sur le genome viral (Lanciotti et al., precite). Le 
sequen<?age a ete realise avec 0,2 pmoles d'ADNc purifie et 30 pmoles d'amorces, en 
suivant le protocole recommande par le fabricant. L'alignement des sequences est 
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realise a Taide du logiciel CLUSTAL W. 

La sequence genomique complete de la souche IS-98-ST1 du virus 
West-Nile correspond a la sequence SEQ ID NO :I. 

L'alignement des sequences en acides amines de la souche IS-98- 
ST1 (Seq ID NO: 2) et de la souche NY99. presente a la figure 5, montre que la 
souche IS-98-ST1 isolee en Israel en 1998 et la souche NY-99 isolee a New York en 
1999 sont tres proches (divergence de moins de 0,2% au niveau des sequences en 
acides amines). 

CependanL les differences observees dans la souche IS-98-ST1, res- 
pectivement dans les proteines E (A 5 |) ; NS1 (Nn). NS2A (Rim), NS2B (Gs2, E 8 3), 
NS3 (P496, E521) et NS5 (S54, N 2 8o ? A372) sont potentiellement responsables de la 
neurovirulence et des proprietes neuroinvasives observees avec cette souche et 
peuvent servir de marqueur de virulence du virus West-Nile. 

3) Cellules 

Des neurones primaires. des cellules endothelials et des astrocytes 
du systeme nerveux central de souris sensibles homozygotes pour P allele Flv* [Swiss 
ou BALB/c (Janvier)] et de souris resistantes homozygotes ou heterozygotes pour 
Tallele Flv sont isoles d'embryons de 14 jours. Les neurones primaires sont mis en 
culture en milieu Neuobasal (Gibco BRL) supplement^ avec 20% de facteur de diffe- 
renciation B27, 20 mM de glutamine et 40 mg/l de gentamycine comme antibiotique. 

Des cellules de neuroblastome murin Neuro 2a (10 4 cellules/cm 2 ) 
sont cultivees en Labtek a 8 chambres (Nunc) en milieu MEM (GIBCO BRL) sup- 
plement avec 10% de serum de veau foetal (EUROBIO) et 1% d'acides amines non 
essentiels (GIBCO BRL). 

Des cellules d'hepatome humain HepG2 (ATCC n° HB8065) sont 
cultivees dans les conditions classiques telles que decrites dans Marianneau et al., J. 
Virol, 1996. 77, 2547-2554. 

4) Prod u its 

L* interferon a (INFaA/D) est fourni par la societe Biosource 
(PHC4044) et TEGTA par SIGMA. 

Exemple 2 : Les souris de lignees sauvages et de lignees consanguines de labora- 
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toire se differencient par leur sensibilite a I'infection par la souche neuroinvasive 
IS-98-ST1 du virus West-Nile. 

1) Les lignees de souris sensibles. 

Des souris BALB/c agees de 6 semaines sont inoculees par la voie 
intraperitoneale avec 100 UFF de la souche IS-98-ST1 virus West-Nile (UFF:DL50 = 
10), preparee comme decrit a Pexemple 1 . 

Ces souris meurent a 1 00% avec un temps moyen de mortalite de 9 ± 

2 jours (figure 6). 

La cinetique de propagation de la souche IS-98-ST1 dans le systeme 
nerveux central de la souris sensible (BALB/c) a ete analysee a partir des extraits de 
cerveau des souris infectes titres sur cellules AP61, selon la technique decrite dans 
Despres et al. (J. Virol., 1998, 72, 823-829), precite. Les resultats montrent que le 
virus est detecte dans le systeme nerveux central (SNC) murin au 5 cmc jour de I'infec- 
tion et la production virale est maximale au 7 cmc jour (Figure 7). Au 9 cmc jour de I'in- 
fection, le virus n'est plus detecte dans le SNC murin (Figure 7). 

La replication du virus WN dans le SNC et les organes peripheriques 
des souris infectees par la souche IS-98-ST1 est egalement detectee par immuno- 
histologie, selon les protocoles classiques tels que decrits dans Despres et al., 1998 
(precite)et par hybridation in situ, selon les protocoles decrits a Fexemple 1. 

Les anticorps seriques specifiquement diriges contre les proteines du 
virus WN sont titres par ELISA selon le protocole decrit dans Despres et al., 1993 
(precite), en utilisant la souche IS-98-ST1 purifie sur gradient de saccharose telle que 
decrite a Pexemple 1. comme antigene. Les resultats montrent que les anticorps seri- 
ques apparaissent au 5°"* jour de I'infection et sont significativement detectes au 7 eme 
jour (figure 6). 

2) Les souris de lignees resistantes. 

Les souris des lignees SEG ? WMP. STF et MAI qui derivent de sou- 
ris sauvages sont inoculees par la voie intraperitoneale. avec 1000 UFF (100 DL50) de 
la souche IS-98-ST1 preparee selon le protocole decrit a Pexemple 1. 

Contrairement aux souris de laboratoire qui sont sensibles a 
I'infection par la souche IS-98-ST1 et meurent en une dizaine de jours, ces souris 
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derivant de souris sauvages sont resistantes a Tinoculation de la souche IS-98-ST1 et 
neanmoins permissives a la replication de la souche IS-98-STI. En effet, l'infection 
virale des souris derivant de souris sauvages est asymptomatique bien que le virus se 
multiplie in toto cornme le demontre la production d'anticorps seriques anti-WN a 
hauts titres ; en ELISA. les litres des serums a la dilution 1:100 pour 10 6 UFF de 
virion purifie IS-98-ST1 sont superieurs a 1 unite de D.O. a 450 nm. 

Les souris resistantes a Tinfection virale sont utilisees pour la pro- 
duction de serums immuns specifiquement diriges contre les proteines de la souche IS- 
98-ST1 du virus WN. Trois semaines apres inoculation du virus WN, les serums pre- 
leves de souris resistantes (0.045 ml par souris) sont melanges, decomplementes 30 
min a 56°C puis dilues au 1: 10 dans du DPBS* ( v / v ) supplement avec 0,2% ( v / v ) de 
Serum Albumine bovine (Life Technologies) et 0,05% (%) d'azide de sodium. Les 
serums dilues sont repartis en 0,2 ml et conserves a -20°C. Les serums immuns diriges 
contre la souche IS-98-ST1 sont utilises aux dilutions finales de 1:500 pour l'immuno- 
fluorescence indirecte et au 1:1000 pour l'immunoprecipitation des proteines virales 
radiomarquees. 

Exemple 3 : Localisation du locus FIv dans une region de 0,2 a 0,4 cM du chro- 
mosome 5 de souris contenant le gene OAS. 
1) JVIethodes 

a) Modele d'analvse de la resistance a V infection par les Flaviviridae 

(figure 8) 

Des souris males des lignees resistantes MAI/Pas et MBT/Pas sont 
croisees avec des souris femelles des lignees sensibles C57BL/6 et BALB/c. Les souris 
males de la generation Fl sont croisees en retour avec des souris femelles des lignees 
resistantes C57BL/6 et BALB/c pour donner une generation de souris de premier de 
premier croisement en retour (BC1). 

Des souris BC1 agees de 5 semaines sont inoculees par voie intrape- 
ritoneale avec la souche IS-98-ST1, preparee selon le protocole decrit a I'exemple 1, 
dans les conditions decrites a I'exemple 2. 

Les animaux sont observes tous les jours et les taux de mortalite et 
de survie sont determines 14 jours apres Tinfection. 
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b) uenotvpane des alleles Flv 

Les alleles Flv des individus BC1 ont ete cartographies par PCR 
genomique a Paide d'amorces specifiques de 16 microsatellites du chromosome 5 
(Catalogue Research Genetics) entourant le locus Flv (figures 9-11), selon les techni- 
ques courantes de biologie moleculaire en utilisant les protocoles standards tels que 
ceux decrits dans Current Protocols in Molecular Biology (Frederick M 
AUSUBEL2000. Wiley and son Inc, Library of Congress, USA). 
2) Rcsultats 

L'analyse de la distribution des alleles Flv chez les souris BC1 
sensibles et resistantes a P infection par la souche IS-98ST1 montre qu'un allele Flv 1 
est suffisant pour conferer la resistance a Pinfection (figure 12). Les resultats montrent 
egalement que dans ce modele il existe une correlation parfaite entre le phenotype 
resistant et la presence de Pallele Flv r et une correlation presque parfaite entre le 
phenotype sensible et l'absence de Pallele /7v r (figure 12). 

Le genotypage des alleles Flv montre que le locus FLv est localise 
dans une region de 0,2 a 0,4 cM contenant le gene OAS1 (figures 9-11). 
Exemple 4 : Les souris sensibles a Pinfection par les Flaviridae possedent un gine 
OAS mute. 

1) Methodes 

La sequence genomique du gene OAS des souris sensibles 
(C57BL/6) a ete determinee a partir de la sequence du clone BAC RP23-39M18 
(figure 11) selon les techniques courantes de biologie moleculaire en utilisant les 
protocoles standards tels que ceux decrits dans Current Protocols in Molecular 
Biology (Frederick M AUSUBEL, 2000, Wiley and son Inc, Library of Congress, 
USA). 

Les ADNc de Piso forme LI du gene OAS murin ont ete amplifies 
par RT-PCR (kit Titan One Tube RT-PCR; Roche Biochemicals n° 1939 823) et 
sequences par la technique de sequengage automatique (Automat) a Paide des amorces 
suivantes (voir figure 17) : 
Exon 1 
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Fl (SEQ ID N0:9) et Rl (SEQ ID NO: 10) : produit d'amplification 



de 258 pb 
de 396 pb 

de 297 pb 
de515pb 

de 288 pb 
de 501 pb 
de 112 pb 
de 325 pb 

de 244 pb 
de4l8pb 
de 156 pb 
de 340 pb 



Fl (SEQ ID NO:9) et R2 (SEQ ID NO:l 1) : produit d'amplification 
Exon 2 

F2 (SEQ ID NO: 12) et R3 (SEQ ID NO: 13) : produit d'amplification 
F2 (SEQ ID NO: 12) et R4 (SEQ ID NO: 14) : produit d'amplification 
Exon 3 

F3 (SEQ ID NO: 15) et R5 (SEQ ID NO: 16) : produit d'amplification 
F3 (SEQ ID NO: 1 5) et R6 (SEQ ID NO: 1 7) : produit d'amplification 
F4 (SEQ ID NO: 18) et R5 (SEQ ID NO: 16) : produit d'amplification 
F4 (SEQ ID NO: 1 8) et R6 (SEQ ID NO: 1 7) : produit d'amplification 
Exon 4 

F5 (SEQ ID NO: 19) et R7 (SEQ ID NO:20) : produit d'amplification 
F5 (SEQ ID NO: 19) et R8 (SEQ ID NO:21) : produit d'amplification 
F6 (SEQ ID NO:22) et R7 (SEQ ID NO:20) : produit d'amplification 
F6 (SEQ ID NO:22) et R8 (SEQ ID NO:21) : produit d'amplification 



2) Resultats 

L'alignement de la sequence de 1'ADNc des isoformes LI, L2 et L3 
du gene OAS des souris sensibles (C57BL/6) avec la sequence de 1'ADNc de 
l'iso forme LI humaine (figure 3 A, 3B et 3C) montre que I'iso forme LI des souris 
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sensibles possede 3 deletions (nucleotides 100 a 102, 221-232 ; 576-577) et un codon 
stop premature en phase, situe en position (807-809). 

Lalignement des sequences en acides amines des isoformes LI, L2 
et L3 du gene OAS des souris sensibles (C57BL/6) avec la sequence de 1'isoforme LI 
humaine (figure 4) montre que Pisoforme LI des souris sensibles correspond a une 
isoforme LI tronquee de la region C-terminale. laquelle region C -terminate comprend 
la sequence conservee RPVILDPADPT qui est impliquee dans Pactivite enzymatique 
de la 2 J -5 ? OAS. De plus, Pisoforme LI des souris C57BL/6 ne possede pas les 4 
premiers acides amines GSSG du domaine GSSGKGTTLRGRSDADLVVF qui sont 
impliques dans Pactivite enzymatique de la 2'-5 ? OAS. 
Exemple 5 : Modele cellulaire d'etude de Pactivite des genes OAS 

1) Infection de cultures primaires et de [ignees cellulaires par la 
souche IS-98-ST1 du virus West-Nile 

a) Materiels et methodes 

ai) cultures jsrimaires 

Des neurones primaires et des astrocytes du SNC de souris sensibles 
homozygotes pour Pallele Flv s (souris Swiss, Janvier) sont prepares selon les proto- 
cols classiques tels que decrits a Pexemple 1 . Les cellules sont infectees par la souche 
IS-98-ST1 a une multiplicity defection de 20 UFF par cellule (m.i. de 20). L'effet 
cytopathique est observe en microscopie optique, la production virale est analysee par 
titration sur cellules AP61 comme decrit precedemment a Pexemple 1 et ['expression 
des antigenes viraux est analysee par radioimmunoprecipitation a l'aide d'un serum 
immun de souris anti- West-Nile, selon les protocoles classiques tels que decrits dans 
Duarte Dos Santos et al. {Virology. 2000, 274, 292-308). - 

Les resultats montrent que 80% des neurones en culture produisent 
les antigenes viraux : 

- leur profil en gel de polyacrylamide-SDS est presente a la figure 

14 A. 

- la production virale est de [3,0 ± 1,5] x 10 6 UFF/ml apres 20 h 
d'infection et de [7,0 ± 0,5] x 10 7 UFF/ml a 40 h. 

- les effets cytopathiques (ECPs) de type necrotique sont observes 
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apres 48 h d'infection virale. 

En revanche, les astrocytes du SNC murin ne sont pas permissifs a la 
replication du virus WN souche IS-98-ST1. 

a :) .llgnees ceHulaires 

Des cellules de neuroblastome murin Neuro 2a et des cellules 
d'hepatome humain HepG2. cultivees dans les conditions classiques telles que decrites 
dans Duarte Dos Santos et al. (precite) sont infectees a differentes multiplicity 
d'infection par le virus WN souche IS-98-STL prepare comme decrit a l'exemple I. 
L'effet cytopathique est observe en microscopie optique, la production virale est ana- 
lysee par titration sur cellules AP61 comme decrit precedemment a Pexemple 1 et 
1'expression des antigenes viraux est analysee par radioimmunoprecipitation a 1'aide 
d'un serum immun de souris anti- West-Nile, selon les protocoles classiques tels que 
decrits dans Duarte Dos Santos et al., precite. 

Les resultats montrent que les cellules de neuroblastome murin 
Neuro 2a sont permissives a la replication de la souche IS-98-ST1 du virus WN. Une 
m.i. de 4 est necessaire pour infecter 80% des cellules Neuro 2a en monocouche. La 
production virale est de 10 7 UFF/ml (m.i. de 4) apres 40 h d'infection et la mort cellu- 
laire par necrose est massive (Figure 15). La cinetique de production des antigenes 
majeurs prM, E et NS1 a partir de la polyproteine virale presentee dans la figure 4B. 
montre que le demi-temps de formation de la glycoproteine d'enveloppe E est 
d'environ 30 min. La proteine E de la souche IS-98-ST! semble ne posseder qu f un 
seul residu N-glycanne (figure 14C). 

Les resultats montrent egalement que les cellules d'hepatome humain 
HepG2 sont permissives a la replication de la souche IS-98-ST1 du virus WN. A une 
m.i. de 10, la production virale est de [2 ± 1] x 10 6 UFF/ml apres 48 h d'infection et les 
ECPs sont observes a partir de 72 h. 
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2) Analyse de Teffet de PECTA et de 1'INFA sur la replication 
du virus West-Nile et detection de I'activite des genes OAS 

a) Materiels et cellules : 

L'interferon alpha (INFa A/D) est foumi par la societe Biosource 
(PHC4044) et I'agent chelateur EGTA par Sigma.. 

Les cellules Neuro 2a sont cultivees en MEM supplement^ avec 
10% de serum de veau foetal (SVF ; Eurobio) et 1% d'acides amines non essentiels 
(Gibco BRL). Les neurones primaires isoles d'embryons de 14 jours de souris BALB/c 
sont mis en culture en milieu Neurobasal (Gibco BRL) supplement^ avec 20% de 
facteur de differentiation B27. 20 mM de glutamine et de la gentamycine comme 
antibiotique. 

b) Protocoles d'infection et de traitement des cellules neuronales 
parl'INF-a et PEGTA : 

- Infection par la souche IS-98-ST1 du virus WN : 
Les cellules Neuro 2a (10 4 cellules/cm 2 ) cultivees en Labtek a 8 
chambres (Nunc) sont infectees avec la souche virale avec une multiplicite d'infection 
de 4 (cycle unique de replication) ou 0J (cycle replicatif biphasique) Unites Formant 
Foyer (UFF ; titre viral obtenu sur cellules de moustiques AP61) par cellule dans du 
MEM supplements avec 0,2% de serum albumine pendant 90 min a 37°C. Les cellules 
infectees sont incubees avec du MEM a 2% SVF. 

Les neurones primaires de souris BALB/c (# 2,5 10 3 cellules/cm 2 ) 
deposes sur Labtek a 8 chambres (Nunc) sont infectes avec la souche virale avec une 
multiplicite d'infection de 20 UFF par cellule dans du milieu Neuobasal avec 2% SFV 
pendant 90 min a 37°C. Les cellules infectees sont incubees avec du milieu Neuobasal 
avec 2% SFV et 20% B27. 



WO 02/081741 




21 



- Traitement des cellules infectees par I'INF-a 

Les tapis cellulaires sont laves 3 fois avec du milieu non supple- 
ment^ puis traites avec 20 Ul/ml (cellules Neuro 2a) ou 100 Ul/ml (neurones primai- 
res) dTNF-a qui sont additionnes dans le milieu de culture. 

- Traitement des cellules infectees par TEGTA 

Les monocouches cellulaires sont lavees 3 fois avec du PBS deplete 
en calcium et magnesium (Gibco BRL) puis incubees dans une solution EGTA a 
1 mM dans du PBS pendant 150 min a 37°C. Les cellules Neuro 2a sont ensuite incu- 
bees dans du MEM supplement avec 10% SVF et les neurones primaires dans du 
milieu Neurobasal avec 20% de B27. 

- Preparation des sondes OAS murines 

Les neurones primaires de souris BALB/c traites par 20 Ul/ml 
d'INF-a pendant 12 h sont lyses par la solution de lyse du kit ATLAS™ Pure Total 
RNA Labeling System (Clontech, # PT3231-1) et TARN total extrait est precipite 
avec 3 volumes d'ethanol 95% en presence de 0,2 M LiCl pendant 18 h a -20°C. Un 
aliquot de TARN total (0,5 jig) est utilise comme matrice pour la synthese par la tech- 
nique RT-PCR (kit Titan One Tube RT-PCR; Roche Biochemicals n° 1939 823) des 
sondes OAS a Taide des amorces OAS-1 a OAS-4 suivantes : 

OAS-1 : GTCAGACGCTGACCTGGTG (SEQ ID NO: 5, positions 
257-275 ; transcrit L3, [M33863]) 

OAS-2 : AGCTTCTCCTTACACAGTTGG (SEQ ID NO: 6, posi- 
tions 686-707 ; transcrit L3, [M33863]) 

OAS-3 : ACAGTGCAGGTGTGTGAGC (SEQ ID NO: 7, positions 
1379-1398 ; transcrit L2, [X58077]) 

OAS-4 : TCATGTCTCAGAAAGGAAAC (SEQ ID NO: 8, posi- 
tions 1854-1874 ; transcrit L2, [X58077]) 

Le couple d'amorces OAS-1 et OAS-2 a ete selectionne afin 
d'amplifier une region de haute identite nucleotidique entre les 3 transcrits OAS (LI, 
L2 et L3) qui ont ete identifies chez la souris. Le couple d'amorces OAS-3 et OAS-4 a 
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ete dessine dans la region 5' non codante specifique au transcrit L2. Les produits RT- 
PCR sont clones a Faide du TOPO TA cloning (Invitrogen). 

Les ARN totaux de neurones primaires de souris BALB/c, non trai- 
tes, traites avec ITNF-a ou FEGTA ou infectes par le virus WN, en presence ou non 
d ? INF-cc ou d'EGTA. seront hybrides avec les sondes OAS en Northern blot. 

- Activite anti-virale de PINF-ct sur le virus West-Nile 

Apres induction par PIFN-ol trois transcrits des genes OAS, LI, L2, 
L3 sont observes (Rutherford et aL, 1991). Le transcrit L3 est detecte des 4 h post- 
induction, L2 est observe a 12 h post-induction et enfin LI est observe apres 18 h post- 
induction. 

La concentration d'INF-a 20 lU/ml pour les cellules Neuro 2a 
n'altere pas la viabilite cellulaire sur 24 h. 

Les cellules Neuro 2a infectees par le virus WN sont incubees avec 
PrNF-ct (voir §2) d'une part des le debut de Finfection ou d'autre part apres 5 h ou 10 
h d'infection. Ces temps d'incubation avec FIFN-a ont ete selectionnes en fonction 
d'une part des cinetiques de transcription des genes OAS LI, L2 et L3 et d'autre part 
de la cinetique de replication virale. 

L'addition de PIFN-ot des le debut de Tinfection virale reduit de 
85% (m.i. de 4) le nombre total de cellules Neuro 2a positives en antigenes viraux par 
immunofluorescence indirecte a 24 h post-infection. L'addition de PIFN-a a 5 h post- 
infection reduit de 65% (m.i. de 4) le nombre total de cellules Neuro 2a positives en 
antigenes viraux par immunofluorescence indirecte a 24 h post-infection. L'addition 
de PIFN-a a 10 h post-infection reduit de 50% (m.i. de 4) le nombre total de cellules 
Neuro 2a positives en antigenes viraux par immunofluorescence indirecte a 24 h post- 
infection. 

- Activite anti-virale de I'EGTA sur le virus West-Nile 

V incubation de neurones primaires de rat dans un milieu sans 
calcium supplements avec 1 mM de Pagent chelateur EGTA pendant 150 min provo- 
que une augmentation de 350% du niveau transcriptionnel du (ou des) membres de la 
famille OAS. 

Le pre-traitement des neurones primaires de souris BALB/c avec 
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1 mM EGTA pendant 2 h 30 (voir §3) reduit de 50% le nombre total de cellules 
positives en antigenes viraux par immunofluorescence indirecte a 24 h post-infection. 
Le traitement des neurones primaires de souris BALB/c avec 1 mM EGTA pendant 2 
h 30 apres 2 h d ? infection reduit de 50% le nombre total de cellules positives en anti- 
genes viraux par immunofluorescence indirecte a 24 h post-infection. Le traitement 
des neurones primaires de souris BALB/c avec 1 mM EGTA pendant 2 h 30 apres 6 h 
d' infection reduit de 20% le nombre total de cellules positives en antigenes viraux par 
immunofluorescence indirecte a 24 h post-infection. 
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REVINDICATIONS 
1°) Procede de criblage de molecules aptes a stimuler un gene de la 
famille OAS. caracterise en ce qu'il comprend : 

- la mise en culture de cellules, issues d ? un mammifere non-humain 
FW/FW ou FW/FW, 

- I'induction de Texpression des genes OAS par addition 
d' interferon a ou P ou par un stress calcique, notamment par addition d'EGTA, 

- la mise en contact des cellules avec la molecule a cribler, et 

- la mesure de Pactivite d'un gene OAS. par comparaison avec un 
echantillon temoin. 

2°) Procede selon la revendication 1, caracterise en ce que ledit 
mammifere non humain FW/FW est de preference une lignee de souris resistantes 
derivant de geniteurs sauvages appartenant a Tespece Mus musculus musculus ou Mus 
spretus. 

3°) Procede selon la revendication 1 ou la revendication 2, caracte- 
rise en ce que lesdites souris resistantes sont croisees en retour avec des lignees sensi- 
bles de laboratoire. 

4°) Procede selon la revendication 1 ou la revendication 2, caracte- 
rise en ce que ledit gene OAS est selectionne dans Ie groupe constitue par les genes 
autologues et les genes heterologues. 

5°) Procede selon Tune quelconque des revendications 1 a 4, carac- 
terise en ce que Pactivite du gene OAS peut-etre mesuree a Paide de l'une des metho- 
des suivantes : determination de la quantite de transcrits OAS, determination de la 
quantite de proteines 2*-5'OAS produites, determination du niveau d'activite 2'- 
5'OAS ou determination de la sequence des ARNm ou de PADN genomique issues 
des genes de la famille OAS. 

6°) Molecule d'ADN genomique de mammifere (humain ou non- 
humain) correspondant a un locus de resistance a une infection par un Flaviviridae, 
caracterisee en ce qu'elle est constitute par un fragment de 0,2 a 0,4 cM incluant un 
gene OAS inactive codant pour une proteine presentant au moins une mutation dans la 
sequence d'ADNc correspondante, laquelle mutation est selectionnee dans le groupe 
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constitue par une deletion des nucleotides en positions 100 a 102, 221 a 232, 577 a 
578 et une insertion d'un codon stop en positions 807-809, en reference a la sequence 
de I'ADNc de l'isoforme L3 de souris accessible sous le n° GENBANK M33863. 

7°) Molecule d'acide nucleique selon la revendication 6, caracterisee 
en ce qu'elle comprend la sequence du marqueur D5MU368 du chromosome 5 de sou- 
ris. 

8°) Utilisation des molecules d'acides nucleiques selectionnees dans 
le groupe constitue par: 

a) les molecules d ? ADN genomique de mammifere (humain ou non- 
humain) correspondant a un locus de resistance a une infection par un Flaviviridae, 
lesquelles molecules sont constitutes par un fragment de 0,2 a 0,4 cM incluant la 
famille des genes OAS sauvages ou mutes, 

b) les ADNc desdites molecules en a), 

c) les proteines codees par lesdites molecules en a) ou en b), 
pour le criblage de molecules antivirales destinees au traitement des infections par les 
virus de la famille des Flaviviridae. 

9°) Utilisation selon la revendication 8, caracterisee en ce que 
lesdites molecules sont des sequences d : ADN genomique des genes de la famille 
OAS, les ADNc desdites sequences et les proteines correspondantes 

10°) Utilisation d ? un vecteur recombinant comprenant une molecule 
d'acide nucleique selon la revendication 6 ou la revendication 7 ou une molecule 
d'acide nucleique telle que definie dans les revendications 8 ou 9, pour le criblage de 
molecules antivirales destinees au traitement des infections par les virus de la famille 
des Flaviviridae. 

1 1°) Utilisation de cellules contenant un vecteur recombinant com- 
prenant une molecule d'acide nucleique selon la revendication 6 ou la revendication 7 
ou une molecule d'acide nucleique telle que definie dans les revendications 8 ou 9, 
pour le criblage de molecules antivirales destinees au traitement des infections par les 
virus de la famille des Flaviviridae. 

12°) Utilisation d'un mammifere non-humain recombinant compre- 
nant une molecule d'acide nucleique selon la revendication 6 ou la revendication 7 ou 
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une molecule cTacide nucleique telle que definie dans les revendications 8 ou 9, pour 
le criblage de molecules antivirales destinees au traitement des infections par les virus 
de la famille des Flaviviridae. 

13°) Molecule d'acide nucleique constitute par un ADNc ou une 
sequence d'ADN genomique issue d'un gene de la famille OAS comme medicament 
destine au traitement des infections par les virus de la famille des Flaviviridae, 

14°) Proteine codee par un ADNc ou une sequence d'ADN genomi- 
que issue d'un gene de la famille OAS comme medicament destine au traitement des 
infections par les virus de la famille des Flaviviridae. 

15°) Procede devaluation de la sensibilite d'un individu a 
Pinfection par un virus de la famille des Flaviviridae et/ou de sa reporise a un traite- 
ment par Pinterferon, caracterise en ce qu'il comprend : 

- la mise en culture de cellules a partir d'un echantillon de cellules 

d'un individu, 

- Pinduction de Pexpression des genes OAS par addition 
d'interferon ct ou P ou par un stress calcique, notamment par addition d'EGTA, et 

- la mesure de Pactivite d'un des genes OAS, par comparaison avec 
un echantillon de cellules, obtenues a partir d'un sujet temoin resistant a Pinfection. 

16°) Reactifs utiles pour mettre en oeuvre les procedes selon les 
revendications I a 5 ou 15, caracterises en ce qu'ils sont selectionnes dans le groupe 
constitue par les amorces de sequences SEQ ID NO :5 a 22 ainsi que les sondes 
correspondant respectivement aux positions 257-707 du transcrit de Tisoforme L3 
murine et aux positions 1379-1874 du transcrit de I'isoforme L2 murine (SEQ ID NO: 
31-32). 

17°) Cellules eucaryotes transformees, caracterisees en ce qu'elles 
comprennent une molecule d'acide nucleique de mammifere selon la revendication 6 
ou la revendication 7 ou bien un ADNc ou une proteine telles que definies dans les 
revendications 8 ou 9. 

18°) Mammiferes non-humains transgeniques, caracterises en ce 
qu'ils incluent au moins une copie d'une molecule d'acide nucleique, selon la reven- 
dication 6 ou la revendication 7 ou une molecule d'acide nucleique telle que definie 
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dans les revendications 8 ou 9. 

19°) Mammiteres non-humains recombinants, caracterises en ce 
quMls sont porteurs dau moins un allele du gene OAS inactive. 
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Resultat CLUSTALW 
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Sequence i : hOASl_X02874_ 1322 pb 

Sequence 2 : L3_M33863_ 1412 pb 

Sequence 3 : L2JC58077. 1413 pb 

Sequence 4 ; L1.M55982. 902 pb 

AlignemenL... 

Sequences (3:4) alignees Score : 79 

Sequences (1 :2) alignees Score : 59 

Sequences (2:3) alignees Score : 97 

Sequences (1:3) alignees Score : 58 

Sequences (2:4) alignees Score : 79 

Sequences (1:4) alignees Score : 62 

Groupe 1 : sequences : 2 Score : 26287 

Groupe 2 : sequences : 3 Score : 1438S 

Groupe 3 : sequences : 4 Score : 15936 

Score d'alignement 36139 

L3j*33863_($EoiDNO^CaGGCTGGGAWCCCAGGAAG^^ 

12J(53077_ (SEoidno:25) CCAGGCTGGGAGACCCAGC^GCTCCAC^mAGaTGGAGCACGGACrCAGGAGarCC 
L1_M55982_ <seo[dno:27) ACG"GCrGGC7GCAGAGGTAAAAGCTGGACCTAGGATGGAGCAGGATCTGAGGAGCATCC 
hOASU(02874_ (SEQiDNO:29) — GAGGCAGTTCTGTTGCGACTCTCTCTCCT G7CAATGATGGATCTCAGAAATACCC 

mm • • • m mm mm m m mm 

L3_M33863_ CAGCCT GGACGCT GGACAAGTTCATAGAGGATTACCTC CTTCCCGACACCACCTTTGGTG 

L2JC58077_ CAGCG"GGACGCTGGACAAG7TGATAGAGGA7TACCrCCTTCCCGACACCACGTTGGTG 

L1_M55982_ CGGCCTCGAAGOTGATAA<rrTCATAGAGAACCATCTCCr--CGGACACCAGCrTCrGTG 

hOASU<02874_ CAGCCAAATG"CrGGACMGrrGATTGAAGACrATCrGTGCCAGACACG7GTT7CCGCA 

• mmm mm mm mmmmmmmm mm m m mmm m mmmmm mm m 

L3J63863. CTGATGTCAAATCAGCCGTGAATGTCGTGTGT^ 

L2JCS8077. CrGATGTCAAATCAGCCGTGUTGTCGTGTGTGATTTCCTGAAGGAGAGATGCTTCCAAG 

L1_M55??.: G"GACCTCAGAGAAG7CATAGATGCCCrGTGTGCrcrCCTGAAGGACAGATCCrrCCGGG 

hOA5i_X0Z374_ TGCAAATCGACCATGCCATTGAGiTCATCTGTGGGTTCCTGAAGGAMGGTGOrTCCGAG 

• mmm m mm mmmm •* • - 

13J*33863_ GTGCTGCCCACCCAGTGAGGGTCTCCAAGGTGGTGAAGGGTGGCrCCrGAGGCAAAGGCA 

L2JC58077_ GTGCTGCCCACCCAGTGAGGGTCrCCAAGGTGGTGAAGGGTGGCrCCTCAGGCAAAGGCA 

ll_M55982_ GCCCCGTCCGCCGAA7GAGGGCCT CTAAAGGGGTCaJaGGG^V"- - t« ? -.-^AAAGGCA 

hQASU(02874_ GTAGCTCCrACCCrGTGrGTGTGTCCAAGGTGGTAA^GGGTGGCrCGrCAGGCAAGGGCA 



L3JH33863. CCACACrCAAGGGCAGGTCAGACGCrGACCrGGTGGTGTTCCTTAACAATCrCACCAGCr 

12JC58077_ CCACACTCAAGGGCAAGTCAGACGCTGACCTGGTGGT(ITTCGTAACAATCTCACCAGCr 

UJH55982. CCGCGCTCMGGGGAGCrCAGACGCTGACCTGGTGCrrGTTCCrrAACAATCT 

HOASLJC02S74. CCACCCTGAGAGGCCGATCTGACGCrGACCTGtrrn^^ 



13_M33863_ TTGAGGATCACrrAAACCGACGGGGAGAGTTCATCAAGGAAATTAAGAAACAGGTGTACG 

L2.XS8077. TTGAGGATCAG7TAAACCGACGGGGAGAGTT CATCAAGGAAATTAAGAAACAGCTGTACG 

L1_M55982_ TTGAGGATCAGTT AAACCAACAGGGAGTGTTGArTAAGGAAATTAAGAAAGAGCTGTGCG 

hOASUC02874_ ttcaggatcagttaaatcgccggggagagttcatccaggaaattaggagacagctggaag 



• mmm mm 



L3JK33863 AG<rrTCAGGATGAGAGACGTTTTAGAGTGAAGTTTGAG 

L2JC58077 AGGTTCAG(>TGAGAGACGTTTTAGAG7CAAGTTT^ 

ILX55982 AGGTTCAGCATGAGAGACGTTGTGGAGTGAAGTTTGAGGTCCACAGTTTAAGGAGTCCCA 

hOASU<02874 CCTGTCAMGAGAGAGAGCACTrrCCGTGAAGTTrW^ 



L3J63863 ACGCCCGGTCTCrGAGCTTGWGCrGAGCGCCCCCCATCTGCATCAGGAGGTGGAGTTTG 

12JCS8077 ACGCCCGGT(TCrGAGCrTCAAGCTGAGCGCCCCCCATCTGCATCAGGAGGTGGAGTTTG 

L1_MS5982_ AG'CCCGGGCTG'GAGCrrCAAGCTGAGCGCCCCCGACGrGCrGAAGGAGGTGAAGTTTG 

HOASUC02874. ACCCCCGTGCGCTCAGCTTCGTAaGAGTTCGCTCCAGCTCGGGGAGGGGGTGGAGTTCG 



mmm mmmm •••• • 



FIGURE 3A 
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L3 M33863 ATGTGCTGCCAGCCTTTGATGTCCTGGGTCATGTT^ 

L2JC58077 ATGTGGn"CCAGCCTTTGAT(rrCCTG(jGTCATGGTAGTATCAATAAGAAGCCTAATCCCT 
LI M5598Z_ ATGTGCTGCCAGCCTATGATTTACTGGATCATCTT AACATCCTCAAGAAGCCTAACCAAC 
hOASl_X02874_ ATGTGCTGCCTGCCTTTGATGCCCTGGGrCAGTTGACTGGCAGCTATAAACCTAACCCCC 

******* ** • • • » ••■mm • *•* mmm m mm mmm m m 

-L3.M33863 GAATCT ATGCCATCCTCATCGAGGAATGTACCrCCCTGGGGAAGGATGGCGAGTTCrCr A 

L2 X58077 TAATCTACACCATCCTCATQGGGAATGTACCrCCCrGGGGAAGGATGGCGAGTTCrG'A 

L 0*55982 AATTCTACGCCAATCTCATC-AGTGGCGTACCCGCC--GGGAAGGAGGGCAAGTTATCGA 

hOASl_X02874_ AAATCTATGTCAAGCTCATCGAGGAGTGCACCGACCrGCAGAAAGAGGGCGAGTTCTCCA 



L3_M33863 CCTGCTTCACGGAGCTCCAGCGGAACTTCCTGAAGCAGCGCCCAACCAAGCTGAAGAGTC 

L2 X58077 CCTGCrTCACGGAGCrCCAGCGGAACrTCCTGAAGCAGCGCCCAACCAAGCTGAAGAGTC 

ll_M55982_ TCTGCrrTATGGGGCTTCAGAACTACrTCCrGAACrGTCGCCCAACCAAGCrGAAGCGCC 

hOASl X02874. CCTGCTTCACAGAACTACAGAGAGACrTCCTGAAGCAGCGCCCCACCAAGCTCAAGAGCC 



L3_M33863_ TCATCCGCCTGGTCAAGCACTGGTACCAACTGTGTAAGGAGAAGCTGGGGAAGCCATTGC 

L2JC58077 TCATCCGCQGGTCAAACACTGGTACCAAG'CTGTAAGGAGAAGCTGGGGAAGCCACrGC 

L1_M55982_ TCATCCGCCTGGTCACGCACTGGTACCAACrGTGTAAGGAGAAGCrGGGGGACCCGCTGC 

hOASU(02874_ TCATCCGC CTAGTCAAGCACTGGTACCAAAATTGT AAGAAGAAGCTT GGGAAGC — TGC 



•*•••***** •*** 



mmmmmm ******* *** * * 



L3_M33863_ CTCCACAGTACGCCCTAGAGTTGCTCACTGTCrTTGCCTGGGAACAAGGGAATGGATGTT 

L2J(58077_ CCCCACAGTATGCCCrGGAGCTACrCACrGTCrATGCCTGGGAACAGGGGAATGGATGTA 

L1_M55982_ CCCCACAGTATGCCCTGGAGCTGCrCACACTCGATGCCTGGGAGTATGGGAGTCGAGTAA 

hOA5UC02874_ CACCTCAGTATGCCCrGGAGCTCCTGACGGTCTATGCTTGGGAGCGAGGGAGCATGAAAA 



L3_M33863_ ATGAGTTCAACACAGCCC4GGGCrTCCGGACCGTCTTGGAAG"GGTCATCAATTATCAGC 

L2JC58077_ ATGAGTTCAACACAGCCCAGGGCTTCCGGACCGTCrTGGAACTGGTCATCAATTATCAGC 

L1_M55982_ CTAAATTCAACACAGCCCAGEGCTTCTGAACCGTCTTC 

hOASlJ(02874_ aamCAAa<^GCCCAA5GAmCGGACGGTCTTGGAAmGTaTAAAaACCAGC 

• ******»••»•*** *• ** * mm ********* • •**• ** ** * * 

13J*33863_ ATCTTCGAATCTACrGGACAAAGTATTATGAGTTCAACACCAGGAGGTCrCCAAATACC 
L2JC53077. ATCTTCGMTCTACTGGACAAAGTATTATGACTTTCAACACAAGGAGGTCTCCAAATACC 
L1_M55982_ AGCTT CftAATCT ACT GGACA^GTATTATGACTTTCGACATCAAGAGGTCTCrGAATACC 

hOASl_X02874_ AACTCTGCATCT ACTGGACAAAGT ATTATGACTTTAAAAACCCCATTATTGAAAAGTACC 
• *• •**•»*«***** ************* * * * * **** 



L3J433863_ TGCACAGACAGGTCAGAAAAGCCAGGCCTGTGATCCTGGACCCAGCrGACCCAACAGGGA 

L2JC58077 TGCACAGACAGCTCAGAAAAGCCAGGCCTGTGATCGrGGACCCAGCTGACCCGACAGGGA 

ll_M55982_ TGCACCAACAGCTCAAAAAAr =■ - 

hOASU(02874_ TGAGAAGGCAGCTCACGAAACCCAGGCCTGTGATCCTGGACCCGGCGGACCCTACAGGAA 



******* *** 



L3^M33863_ 
L2JC58077. 
L1_M55982_ 
hOASl_X02874_. 



ATGTGGCCGGTGGGAACCCAGAGGGCTGGAGGCGGTTGGaGAAGAGGCTGATGTGTGGC 
ATGTGGCTGGTGGGAACCCAGAGGGCrGGAGGCGGTTGGCTGAAGAGGCTGATGTGTGGC 

ACTTGGGTGGTGGAGACCCAAAGGGTTGGAGGCAGCrGGCACAAGAGGCTGAGGCCTGGC 



L3_M33863_ 
L2JC58077_ 
L1_M55982_ 
hOASU(02874_ 



TATGGTACCCATGTTTTATTAAAAAGGATGGTTCCCGAGTGAGCTCCTGGGATGTGCCGA 
TGTGGTACCCATGTTTTATGAAAAATGATGGTTCCCGAGTGAGCTCCrGGGATGTGCCGA 

TGMTTACCCATGCITrAAGAATTGGGATGGGTCCCCAtrrGAGCrCCrGGATTCrGCTGG 



L3.M33863. 
L2JC58077, 
L1_MS5982_ 
hOASl_X02874_ 



CGGTGGTTCCrGTACCTTTTGAGCAGGTAGAAGAGAACTGGACATGTATCCTGCTGTGAG 
CGGTGGTTCCrGTACCrTTTGAGCAGGTGGAGGAGAACTGGACATGTATCCTGG"GTGAG 

TGAGACCTCCTGCTTCCTCCCTGC CATTCATCCCTGCCCCTCTCCATGAA 



FIGURE 3B 
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13JG3863. 
LZJC58077. 
ll_M55982_ 
HOASUC02874. 



CACAGCAGCACCTGCCCAGGAGACTGCrGGTCAGGGGCATTTGCTGCrcrGCrGCAGGCC 
CACAGCAGCACCTGCCCAGGAGACTGQGGTCAGGGGCATTTGCTGCrcrGCTGCAGGCC 

GGrTGAGACATATAGCrGGAGACCATTCTTTCCAAAGAACTTACCTCr-TGCCAAAGGCC 



L3J433863- 
L2_X58077_ 
ll_M55982_ 
hOASlJC02874_ 



CATGACCCAGTGAGGGAGGGCCCCACCTGGCATCAGACTCCGTGCiTCTGATGCCTGCCA 
CATGACCCAGTGAGGCAGGGCCCCACCTGGCATCAGACTCCGTGCTTCTGATGCCTGCCA 

ATrrA--TATTCATATAGTGACAGGCrGTGCrCCATATTTTACAGTCATTTTGGTCACAA 



L3J433863_ 
L2J<58077_ 
L1_MS5982_ 
hOASUC02874_ 



GCCATGTTTGACTCCTGTCCAATCACAGCCAGCCTTCCTCAACAGATTCAGAAGGAGAGG 
GCCATGTTTGACTCCTGTCCAATCA(>GCCAGCCTTCCTCAACAGATTCAGAAGGAGAGG 

TCGAGGGTT- - -TCTGGAATTTTCACATCCCTTGTCCAGAATTCATTCCCCTAAGAGTAA 



L3_M33863_ 
L2JC58077. 
ll_M55982_ 
hOASl_X02874_ 



AAAGAACACACGCTTGGTGTCCATCTGTCCACCTGTTGGAAGGTTCTGTCTGACAAAGTC 
AAAGAACACACGCTT GGTGTCCATCTGTCCACCTGTTGGAAGGTTCT*GTCTGACAAAGTC 



TAATAAATAATCTCTAACACCAAAAA- 



L3_M33863_ 
L2JC58077. 
ll_M55982_ 
HOA5UC02874. 



TGATCAACAATAAACCACAGCAGGTGCC-GTCA 
TGATCAACAATAAACCACAGCAGGTGCCCGTCA 



FIGURE 3C 
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PCT/F^^l 



Sequence I : hOAS 1 JC02874. 364 aa 
Sequence 2 : L3_M33863_ 367 aa 

Sequence 3 : L2JC58077. 367 aa 

Sequence 4 : L1_M55982_ 251 aa 

Aiignemenc... 

Sequences (3:4) alignees Score : 66 

Sequences (1:2) alignees Score : 67 

Sequences (2:3) alignees Score : 95 

Sequences (2:4) alignees Score : 66 

Sequences (1:3) alignees Score : 67 

Sequences (1:4) alignees Score : 58 
Alignemenc. 

Groupe 1 : sequences : 2 Score : 6013 

Groupe 2 : sequences : 3 Score : 5336 

Groupe 3 : sequences : 4 Score : 3306 
Score d'alignement 8114 

l3JG3863_(SEQiDNO:2«)MEHGLRSrPAMinKra 

L2jC58077jSEQIDNO:26)|^HClJtfIPAmOI^ 

hOASlJC02574lSEOiDW-;o>^ 
LIJ455982_<SEOiDNO:23>MEQDLJttIP^^ 



L3_M33863_ 
L2JC58077_ 
hOASl_X02S74_ 
IU453S82_ 



KGGSSGKGTTLKGRSDAflLWFlitNlTSFEDQLNRRGEFrKEIK^^ 
KGGSSGKGTTLKGRSOAOLWFINNLTSFEDQIXW^ 

KGGSSGXGTTLRGRSDADLV^lSPLTTrQOQU^RKGEFIQEIRRQLEACQREKALSVKF 
KG' — KGTALKGRS0A0LWFLNNlT5FEDQLNQQGVtL<£IKKQLCHVQHERRCGVKF 



L3.M33863. EVOSSWWPI^SLSFKLSAPHLHQEVEFDVlPAFDVlGHWTSSJCPOPRIYAILIEEaS 

12JC58077. EVQSSWWfiARSLSFKLSAPHLHQEVEFOV^ 

hOASU(02374_ EVQAPf^PP^lSFVlSiLQLGEGVErOVLPAFDAtGQLTGSYKPNPqiYmiEECTD 

L1_M55982_ EVHSLRSPNSRAi^FiOSAPOiLKEVKJW^ 



13JG3863, LGfCDGEFSTCFTELQRNFLKQRPTKLJGLIRLVW^QLCKEKLGKPLPPQYALELLTVF 

12JC58077. LGW)GEFSTCFTELQRNFUQRmLiGLIRLVKHWyQLCKEKLGKPLPPQY 

hOASUC02874_ IQKEGEFSTCFTELQitoFUCQRPTKlKSLlRL 

LU<55982_ AGKEGiCLSICFMGLQKYFLNCRmLlCRLIRL\nWQtCKEiaGDPLPPQYAL£LLTLO 



L3_>G3863_ AflEQGNGCYEFfrTAQGrRTVLELVINYQHLRIYWT^ 

L2.X53077_ AWEQGNGCNEFNTAQGFRTVLELVIhrr(^LRIYWTKYYDFQHKEVSiCn-HRQLRKARPVl 

hOA5UC02874_ AWERGSMKTHFffTA<#FRTVl£LVIWQ^^ 

LU6S982. AWEYGSRVTXFNTAQGF- - — ' — - 



13_M33863_ 
L2J(58077_ 
hOASUC02S74_ 
LJLX55982. 



L0PAOPTGWAGGNPEGWRRLA£EAOVWLffYPCFIKKIX»5RV55WDVPTVVPVPFEQV^ 

LDPA0PTGiWAGGNPE(^RUEEA0mWYPCr>«N0G5RVSSWDVPTWPVPFEQVEE 

LDPAOPTGNLGGGDPKQVRQLAQEAEAW.NYPCFKNWD'GSPVSSVn[L 



L3.M33863. 
L2JC58077. 
hOASUC02874. 
ll_M55982_ 



NWTCIIL 

Nwrrciit 

APLHEA- 



FIGURE 4 
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C 

CI MS KK ?GG ?G KS RA VMM L XRGM ? R VL S L I G L XRAMLS L I DG KG ? I R F7LA L 

FLA MS XX ?GG ?GKS RAVNML XRGMr R VL5 L I GLXRAML S L I DGXG ? I R FVLA.L 



CI LA.F FRFT AI AP7RA VL ORWRG VN XQTAMXH L LS FXXELGT LT S A I NRRS 5 

TLA LA F FRFTA.I A?7 RAV L D R WRG VN KQTAMKK 1 L S f XX E LGT LT SAX NRRS 5 



CI XQ KXRGGKTG I AVM I G L I A.S VG AVT LS N FQGKVMMT VN AT DVT DV I T I ?7 

FLA XQKXRGGX7G I AVM I GL IAS VGAVTLSN r QGKVMMT VNAT DVTDVITIPT 



C r AAGXNLCI VRAMDVG YMCDDT I T YEC ? VLSAGNDPE DI DCWCTKSAVYVR 

TLA AAG XNLC I V RAM DVG YMCD DT I T YEC r VLS AGND PE D I DCWCTXS A V Y VR 



M 

CI YGRCT KTRH S RRS RRS L T YQTKG E S ? LAN XXGAWMDS T KA7R Y LVXT E S W 

FLA YG RCTXT RH S RRS RRS L T VQT KG E S T LANKXGAWM DS T XATR Y L VKT E S W 



E 

CI I L RN PG YAL VAA VI GWMLG S NTMQR W fWLL L L VA? A YS FNCLGMS N"R D 

TLA I LRN PG YAL VAA V I GWMLG S NTMQ RWFWLL L L VAP A Y S FNCLGMS N R D 



CI FLEGVSGATWVDLVLEGDSCVT I MS XDKPT I DVXMMNMEAANLAEVRS YC 

TLA FLEGVSGATWVDLVLEGDSCVT IMS XDKPTI DVXHMNMEAVNLAEVR5 YC 



CI Y L AT VS DLS T XAAC ?TMG E AH N D KRAD PA FVC RQG W DRGWGMGCG L FG K 

FLA YLATVSDLSTKAACPTMGSAKNDKRADPAFVCRQGVVDRGWGNGCGLFGK 



CI GS I DTCAXFACSTKAIGRTI LXENI XYEVAI FVKGPT7VESHGNYSTQVG 

FLA GS I DTCAXFACSTKAIGRT I LXENI KYEVAI FVKGPTTVES HGNYSTQVG 



CI ATQAGRFSITPAAPSYTLKLGEYGEVTVDCEPRSGIDTNAYYVMTVGTKT 
FLA ATQAGRFSITPAAPSYTLKLGEYGEVTVDCEPRSGIDTNAYYVMTVGTKT 



CI FLVKREWFMDLNLPWSSAGSTVWRNRETLMEFEEPHATXQSVIALGSQEG 
FLA FLVHREWFMDLNLPWSSAGSTWJRNRETLMEFEErHATXQSVIALGSQEG 



CI ALKQALAGAIPVEFSSNTVKLTSGKLKCRVKMEXLQLKGTTYGVCSKAFX 
FLA AL KQALAGAI ? V E FS S NT VXLT S G H LKC R VXME XLQL KGT T YG VC S KAFX 



CI FLGTPADTGHG7WLELQYTGTDGPCXVPISSVASLNDLTPVGRLVTVN? 
FLA FLGTPADTGHGTVVLELQYTGTDGPCXVP I SS VASLNDLTPVGRLV7VNP 



CI FVSVATANAXVLIELEPPFGDSYIVVGRGEQQINHHWHXSGSSIGXAFTT 
FLA FVSVATANAKVLIELEPPFGDSYIWGRGEQQINKHWHKSGSSIGKAFTT 



FIGURE 5A 
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CI TLKGAQRLAALGOTAW0FGSVGGVF TSVGKAVHQVrGGAFRSLFGGMSWI 

FLA TLKGAQRLAALGDTAWDFGSVGGVFTSVGKAVHQVrGGAFRSLFGGMSWI 



NSi 

CI TQGL LGA.L LLWMG I NARDR5 1 AL T FLA VGGV L L F L S VN VHADTGCA I D I S 

FLA T QG L LGAL L LWMG I N ARDR S I AL T FLA VGGV L L F L S VN VH AO T GC AI D I S 



CI RQ £ L RCG NG V F I H N DVEAWM D R Y K Y Y ? E T PQG LAK 1 1 QXAK XEG VCG L RS 

FLA RQ F L RCGSG V F I H N" C VEAWMD R Y K Y Y PET ?QG LAK 1 1 QKA-K X EG VCGLR S 



CI VS RLE HQMW EAVXD £ L NT L LKE NG V D L S VWEXQ EGM Y KS A ? KRLTATT E 

FLA vsrlehqweavkdelntllkengvdlsv*vvekqegmy:<5a?krltatte 



CI XLEIGWXAWGKSILFA?£LANNTFWDG?ETKEC?TQNRAWNSLEV£DFG 
FLA KLE IGWKAWGKS I L FAPELANNT FWDG PETKEC PTQNRAWNS LE V£DFG 



CI FGLTSTRMFLKVRESNTTECDSKIIGTAVKNNLAIHSDLSYWIE5RLNDT 
FLA FGLTSTRMFLKVRESNTTECDSKIIGTAVKNNLAIHSDLSYWIESRLND? 



CI WKL£RAVLG£VKSCTWPETHTLWGDGILESDLIIPVTIAG?RSNHNRRPG 
FLA WKLE RA VLG E VK3C T W ? £ 7 K ? L WG DG I L£ S D L 1 1 ? VT LAG ? RS NH NRR ?G 



CI YKTQNQGPWDEGRVEIDFDYCFGTTVTLSESCGHRGPATRTTTESGKLIT 
FLA YKTQNQGPWDEGRVEIDFDYCPG77VTLSESCGKRGPA7RTTTE5GXLIT 



NS2A 

CI OWCCRSCTL??LRYQTDSGCWYGMEIR?QRHDEKTLVQSQVN"AYNADMID 
FLA DWCCRSCTLPPLRYQTDSGCWYGMEIRPQRHDEKTLVQSQVNAYNADMID 



CI PFQLGLLWFLATQEVLRKRWTAKI5MPAILIALLVLVFGGITYTDVLRY 
FLA P FQLGLL VVJLA 7 CE VLRKRWTAXI S& ?AI L I ALL VL V FGG I T Y7 DVLR Y 



CI VILVGAAFAESNSGGDV\ r KLALMATFKIQ?VFMVASFLKARWTNQENILL 
FLA VILVGAAFAESNSGGDWHLAXMATFKIQPVFMVAS FLKARW7NQENILL 



CI MLAA V F FQMA Y K DARQ I L L WE I ? D VLN S LAVAWM ILRAITFTTTS N VW ? 

FLA MLAAVF FQMAYK DARQ I LLW£ I F DVLNS LAVAWM I LRAITFTTTSNVWP 



CI LLALLT PRLRCLNLOVYR I LLLMVG IG5 L I REKRS AAAKKKGASLLCLAL 

FLA LLALLTPGLRCLNLDVYRILLLMVGIGSLIREKRSAAAKKKGASLLCLAL 



NS23 

CI A.S TG L FN ?M I LAAG L I AC D ? NRKRG W? AT E VMT A. VG LM FA I VGG L AEL D I 

FLA AS TGL FN ?M I L.AAG L I A.C D ?N RKRGWPAT E VMTAVGLM FAI VGGLAELD I 



CI DSMAIPMTIAGLMFAAFVISGKSTOMWIERTADISWESDA2ITGSSERVD 
FLA OSMAIPMTIAGLMFAAcVISGKSTDMlfllERTAOISWESDAEITGSSERVD 



CI VRLDDGENFQLMNDPGAPWKIWMLRMVCLAISAYTPWAILPSWGFWITL 

FIGURE 5B 




PCT; 




169 



9/23 



FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA. 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 



VRLDDDGNFQLMNDPGA?WKIWMLRMVCLAISAYT?WAILPSWGFWITL 



N'S3 

Q Y 7 KRGG VLW D7?S ?XE Y KXG D77 TG V Y R I M7 RG LLGS YQAG AG VMVEG V 

qytkrggvlwot?s?kh:ykkgdtttgvyrimtrgllg3yqagagvmvfgv 



c K T LWH TTKGAALMSG EGRLD ? Yvv'G 3 VKE DRLC ":*GG PWKLQK KWNGQDE7 
FH T LWKTTKGAALM5GEG RLQ? YWG 3 VKE DRLCYGG PWKLQH KWGQDE V 



GMIW£?GKNVKNVQTK?GVFKT?EGH:IGAV7LCF?TGTSGS?IV0KNGD 
QMIWE?GKNVKNVQTK?GVFKT?EGEIGAV7LDF?TG7SGS?IVDKNG0 



viglygngvimpngsyisaivoger-mdepipagfepemlrkkqitvldlh 
viglygngvimpkgsyi5aivqgermdepipagfepemlrkkqi7vldlh 



PGAGKTRRI LPQ 1 1 KEAI NRRL RTAVLAPTR WAAEMAEALRGL ? I RYQT 
PGAG X7 RR I L ?Q 1 1 KEA I NRRLRT A VLAPTR WAAEMAEALRG L PI R YQ7 



SAV?REHNGN£IVDVMCKATLTKRLMSPHRVFNYNLFVMDEAH?TDPASI 
SA.VPREHNGNE I VDVMCHAT L7 K?.!MS P HRVPN YNLFVMDEAK FT DPAS I 



AARGYIS7FCVELGEAAAIFMTA7PPGTSDPFPESNSPISDLQTEIP0RAW 
AARG Y 1 3 7 KVELGEAAAI FMT AT P PG7 S D ? F? E S N' S ? I S DLQ7 E I PDRAW 



NSGYEWITEYTGKTVWrvPSVKMGNEIALCLQRAGKKWQLNRKSYETEY 
NSGYEWrTEYTGKTVW=V?SVKMGNEIALCLQRAGKKWQLNRKSYETEY 



F KC KN D DWD FVT 77 D I S EMGA.N FKAS R VI DS RK3 VKP7 1 1 7 EG EG R V I LG 
PKCKNDDWDFVI77DI SEMGAN FKAS R V I DS RXS VX?7 1 1 7 E G EGR V I LG 



EPS AV7 AASAAQRRGRIGRNPSQVGDEYCYGGHTNEDDSNFAHW7 EAR I M 
E P S AV7 AASAAQRRG R I G RN ? SQVG DEYCYGGH7NEDDSN FA.H W7EAR I M 



PDNIMMPNGLIAQFYQPEREKVYTMEGEYRLRGEERKNTLELLRTADLPV 
LDNINMPNGLIAQFYQPEREKVY7MDGEYRLRGEERKNFLELLR7ADLPV 



WLAYKVAAAGVSYKORRWCrDGPRTNTILEDNNEVEVITKLGERKILRPR 
WLAYKVAAAGVSYHDRRWCFDGPRTN7ILEDNN'EVEVI7KLGERKILR?R 

NS4A 

WIDARVYSDHQALKAcKDFASGKRSQIGLIEVLGKMPEHFMGKTWEALDT 
WIDARVYSDHQALKAFKDFASGKRSQIGLIEVLGKMPEHFMGKTWEALD7 



M Y VVA7 AE KGG RAH RMAL E E L P DA.LQ7 1 A.L I A.L L S VM7MG V F FLLMQRKG 
MYWA7AEKGGRAHRMALEELPDALQTIALIALLSVM7MGVFFLLMQRKG 



IGKIGLGGAVLGVA7FFCWMAEVPG7KIAGMLLLSLLLMIVLIPEPEKQR 



FIGURE 5C 
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FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



IGXIGLGGAVLGVATFFCWMAEVPGTXIAGMLLLSLLLMIVLIPEPEKQR 



NS42 

SQTONQLAVFLICVMTLVSAVAANE.MGWLDKTXSDISSLFGQRIEVKENF 
SQTDNQLAVFLICVMTLVSAVAANFMGWLDKTXSDISSLFGQRieVKZNF 



S MG £ : L LDLR ? AT AW S 1 Y A V77 A VLT ? L L XK L 1 7 S D Y I NT S 1 T 3 1 N VQAS 
SMGEFLLDLRPATAWSLYAVfTAVLTPLLKHLITSDYINTSLTSINVQAS 



AL FT LARG F? FV D VG VS ALL LAAGC WGQ V7 L T VT VTAAT LL FCH Y A YMV ? 
AL FT LARG F P FV C VG VS AL L LAAGCHGQ V? L T VT VTAAT L L FC K Y A YMV ? 



GWQASAMRSAQRRTAAG IMKNAWDG I VA7 DVPELERTT ? IMQKXVGQ IM 
GWQA£AMRSAQRRTAAG IMKNAWDG I VA7DVPELFRTT ? IMQXXVGQ IM 



L I L VS LAAWVN PS VKT VRZAG I L I TAAAVT I WSNGAS S VWNATT AIGLC 
L I L VS LAA VWN ?S VXT VREAG I L I TAAAVT L WE NGAS S VWNATTAI GLC 



NS5 

HIMRGGWLSCLSITWTLIKNMSKPGLKRGGAKGRTLGEVWKERLNQMTKE 
K IMRGGWLSCLS ITWTLI XNMEKPGLKRGGAXGRTLGEVWKERLNQMTKE 



E FTR YRKEAI I E VDRS AAXK ARXEGN VT GG H S VS RGT AKL RWL VE RR FL E 
E FTRYRKEAI I E VDRSAAXHARXEGN VTGGH P VSRGTAKLRWL VERRFLE 



PVGKVIDLGCGRGGWCYYMATQKRVQEVRGYTKGGPGKEEPQLVQSYGWN 
PVGKVIDLGCGRGGWCYYMATQKRVQEVRGYTKGGPGKEEPQLVQSYGWN 



IVTMKSGVDVFYRPSECCDTLLCOIGES5SSAEVEEHRTIRVLE.WEDWL 
IVTMKSGVDVFYRPSECCDTLLCDIGESSSSAEVEEHRTIRVLEMVEDWL 



HRGPREFCVKVLCPYMPKVIEKMELLQRRYGGGLVRNPLSRNSTHEMYWV 
HRGPREFCVKVLCPYMPXVIEXMELLQRRYGGGLVRNPLSRNSTHEiMYWV 



SRASGNWHSVNMTSQVLLGRMEKRTWKGPQYEEDVNLGSGTRAVGKPLL 
SRASGNWHSWMT5QVLLGRMEXRTWKGPQYEEDVNLGSGTRAVGKPLL 



NSDTSKINNRIERLRREYSSTWHHDENHPYRTWNYHGSYDVKPTGSASSL 
NSDTSKIKNRIERLRREYSSTWKKDENHPYRTWNYKGSYDVKPTG5ASSL 



VNGVVRLLSXPWDTITNVTTMAMTDTTPFGQQRVFXEXVDTKAPEPPEGA 
VNGVVRLLSKPWDTITNVTTMAMTDTTPFGQQRVFXEXVOTKAPEPPEGV 



KYVLNETTNWLWAFLAREXRPRMCSREEFIRXVNSNAALGAMFEEQNQWR 
KYVLNETTNWLWA FLARE XRPRMCS RE EFIRXVNSNAALGAMFEEQNQWR 



CI 



SAREAVEDPKFWEMVDEEREAHLRGECHTCIYNMMGKREKKPGEFGKAKG 
FIGURE 5D 
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FLA SAREAVEDPKFWEMVDEEREAHLRGECHTCIYNMMGKREKKPGEFGKAKG 

CI SRAIWr^LGARrLErEALGFLNEDHWLGRKNSGGGVEGLGLQKLGYILR 

TLA S RA I W FMWLGAR FL E FE ALGF LN E DKW LG R KN SGGG VEG LG LQ KLG Y I L R 

CI EVGTRrGGXIYADDTAGWDTRITRADLENEAKVLELLOGEHRRLARAIIE 

FLA EVGTRPGGKIYADDTAGWOTRITRADLENEAKVLELLDGEHRRLARAIIE 

CI L T Y RH KW KVMR ? AADGRT VMD V I S RE DQ RG S GQ WT YAL NT FT N LA VQL 

FLA L T YRHKWKVMR? AAOGRT VMDV I S RE DQRGSGQ VVT YAXNT FTN LAVQL 

CI VRMMEG EG V I G ? D D V E KLT KGKG ? KV RT W L FENG E E RLS RMAVS G 0 DC W 

FLA VRMMEGEGVIGPDDVEKLTKGKGPKVRTWLFENGEERLSRMAVSGDDCW 

CI KPLDDRFAT S LK FLNAMS KV RKD I QEWK PS TGWYDWQQVPFCSNH FT ELI 

FLA KPLDDRFATSLHFLNAMSKVRKDIQEWKPSTGWYDWQQVPFCSNKFTELI 

CI MKDGRTL WPCRGQ DE L VGRARI S PGAGWNVRDT ACLAKS YAQMWLLL YF 

FLA MKDGRTL WPCRGQDE LVGRARI S PGAGWNVRDT ACLAKS YAQMWLLL Y F 

CI K RRDLRLMANA I CS AV? VNWV PTGRTTWS I HAGG E WMTT E DMLE VWNRVW 

FLA HRRDLRLMANAICSAVPVNWVPTGRTTWS I HAGG EWMTT& DMLE VWNRVW 

CI IEENEWMEDKTPVEKWSDVPYSGKREDIWCGSLIGTRARATWAENIQVAI 

FLA I EENEWME DKT ? VEKWS DV? YSGKRE DI WCGS LI GTRARATWAEN IQVAI 

CI NQVRAI IGDEKYVDYMSSLKRYEDTTLVEDTVL 

FLA NQVRAI IGDEKYVDYMSSLKRYEDTTLVEDTVL 



FIGURE 5E 




jour post-inoculation 
FIGURE 6 
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seuil de detection 



FIGURE 7 
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Souris 

Lignees consanguines de laboratoire : 



Souris sauvages : 



BALB/c, C57BL/6, DDK, 129, C3H et DBA/1 
sensibles a Kinfection par le virus WN 



SEG/Pas {Mus spretus), MAI/Pas, MBT/Pas {Mus m. musculus) 
-> resistances a 1' infection par le vims WN 

Generation de souris de premier croisement en retour (BC1) 



Parents 



o^MAJ/Pas ZC57BU6 
d\MBT/Pas X $ BALB/c 



Fl 



¥C57BL/6 
? BALB/c 



BCI 



I 



I 



a) BCI b)8Cl c)BCl d) BCI 

(C57BU6 (C57BU6 (BALB/c (3ALB/c 

X X X .x 

MAI) MBT) MAI) M3T) 



Virus 

Injection du virus West Nile (WN) 
Souris agees de 5 semaines 

Observation des souris pendant les 14 jours suivant l'infecrion 
Genotypage des alleles Fh 

marqueurs flanquant le locus Flv sur le chromosome 5 de la souris 
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Chr5 de souris 



Parents de la generation de premier croisement en retour (BC1) 
: VoJ No. 107 No.27 -Vol 15-4 :Vo.222 No.244 :Vo.l4£ iNoJl 
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FIGURE 10 
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Phenotype 
Flv* 


Survivants 


Morts 


Total 


Resistant 
(Flv7Fh s ) 


108 


0 


108 (55%) 


Sensible 
(Flv'/Fh 1 ) 


21 


74 


95 (45%) 


Total 


129(66%) 


74 (34%) 


203 



* un allele Flv est suffisant pour conferer la resistance 



Figure 12 
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PCT/Fl^Pll69 
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> Exon I 

AGGCITCGATCCCCAC^TACCTGTTCACAACCCCTAACCCCAT^ 

CATGAmCCATATCCGCGCCCTTCCCGCGAAATCK}A.AACTGAAACrrCCCAmCTGOT 

Fl <SEOIDNO:9) 

CAGCCAGCCTAGGAGACACAGGACCTG CTGGCTnr a Ga GCTAAAA GCT GGA CCTa GGA 
TGGAGCAGGATCTCAGGAGCATCCCGCCCrrCGAAGCTTGATAAGTTCATAGAGAAC 
CATCTCCCGGACACCAGCTTCTGTGCTGACCTCAGAGAAGTCATAGATGCCCTGTG 

TGCTCTCCTGAAGGACAGATCCTTCCGGGGCCCCGTCCGCCGAATGAGGGCCTCT 

w <SEQfDNO:i0) 
AAAGGGGTCAAGGTGAGGCTTCCTCAGCCTGAGCTGGC CGAGATGAGGTGGGACAGG 
Rl 

AOTrCAGAAGCCAGGCrCKLAACCCTGATCOT 

TGGOi 1L1 rCCCCCCAAGTCCGACATCTGlArrCK3AGAAGGAGCCrCAGCrACAGTmi 
(SEQIDNOrll) R2 

> Ex° n2 ' R (SEQIDN0:I2) 

TCAGGGCTGACTXATATTCTCCTGCACATCTAGC^ 

TCCATCCATCCATCCATCIATCACCTTGGTGATGGACTCCAGTTCAGCATCTGG 
AGCATGGCTCTCCCTGTCCTTTGTGATTCTL ITTCTI GTCTTTCAGGGCAAAGGCACCGC 
GCTCAAGGGCAGGTCAGACGCTGACCTGGTGGTGTTCCTTAACAATCTCACCAGCT 

TTGAGGATCAGTTAAACCAACAGGGAGTGTTGATTAAGGA.AATTXAGA.AACAGCTG 

R3 (SEQIDNO:Ij) 

TGCGAGGTTCAGCATGAGAGA CGTTGTGGACTr.AAGTTTGAG GTCCACAGTTTAA 
GGAGTCCCAACTCCCGGGCTCTGAGCTTCAAGCTGAGCGCCCCCGACCTGCTGAA 
GGAGGTGAAGTTTGATGTGCrGCCAGCCTATGATTT^ 

GAGAGCCTCAGCTCACCCTTCTGCATGCCTTCATCCTCCCTTCTAGTTCCACCTCTGTGTG 
(SEQIDN0:I4) R4 

TGTGCACATGTGTGTTGCGTA GGTGTTrTrYp"rTrrTnTr;rrr'fTrfTrr ATrrf^pf a a rr ATr,r,r 
> Exon 3 

TGGGAGCAGGGACTTTGX^GTGC^CAGCATGTGTGCAGTCCTAAGGAGTGGTGGGGCAG 
F3 (SEQIDN0:I5) 

ATG<ffiTATATGCGGAGCCrATGCCTGCTGGGGAA^^ 

TAGGCTGTGATrCTGGACCTCKK}GAGAC^ 

CACTGAATGAAATCTTGTmCAGATCATCTTAACX 
F4 . (SEQIDN0M8) 

ATTCTACGCCMTCTCATCAGTGGGCGTACCCCGCCGGGGAACGAGGGCAAGTTAT 

(SE0IDN0:16) Ri 

CGATCTGCTTTATCGGGCTTCAGAAGTACTTCCTG AACTC 

AAGCGCCTCATCCGCCTGGTCACGCACTGGTACCAACTGGX'VAGGCATTGGCCrGGT 

CACTGTGCG<nTCATCTGTACAGAGTGT\GACA 

TCGGCGTCTATTGAGGTA-AIAACTCTATCACATGACCAAAACGCTCCT 

: - (SEQIDN0:I7) Rfi 

TATTCTTATGTTTA CACATCTAA GGCa Ca CTCCaTC j^TTCrX GGGA A GTCA G A GG a aTa AfT 

FIGURE 17 
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> Exon 4 (terminal) 

GCTGTCAcrcAT<xrrcrrcCT^ 

F5 (SEQIDNCM9) 

agcacaca glgiCC AT CTCAACCA CTCAGCTrTTr^rrATAr^Ar aaga acccata ca rr 
CA^TTCA-^GTCACTGGGTGTGACAGTCTCACAjVTA-ACCCTCTCATCACATCATCaCGT^ 

gcagctgajotgagcctgtgagajvgcagccccacacaca^ccaccaggajvccccgt^ 

. F6 (SEQIDNO:22) T 

TTTCTCATT GCCTTTCTCTrCTCA 

CAGTATGCCCTGGAGCTGCTCACAGTCTATGCCTGGGAGTATGGGAGTCGAGTAAC 

(SEQIDNO:20) R7 « 

TAAATTCAA C AC AG CC CAGG GCTTCTG AAC CGTCTTGG.\-ACTGGTCACCA A GTACAAA 

(SEQIDNO:2l) 

CAGCTTCAAATCTA CTGGACAGTGTATTATGA CTTTCG A CATCAA GA G GTCTCTG.AATA CC 
R8 

TGC A CCA A Q A CrCTCA A A A A A 
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WO 02/081741 




LISTE DE SEQUENCES 



<110> INSTITUT PASTEUR 

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (CNRS) 

GUENET, Jean-Louis 

MASHIMO, Tomoji 

SIMON-CHAZOTTES, Dominique 

MONTAGUTELLI , Xavier 

FRENKIEL, Marie-Pascale 

DESPRES, Philippe 

DEUBEL, Vincent 

BONHOMME, Francois 

LUCAS, Marianne 

<120> Utilisation des produits des genes de la famille 2' -5' oligoadenylate 
synthetase (OAS) pour le criblage d'antiviraux et la detection de la sensibilite 
a 1' infection par les Flaviviridae . 

<130> F226/CAS92 PCT 

<140> 
<141> 

<160> 32 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 11029 
<212> ADN 

<213> Flavivirus sp. 

<220> 
<221> CDS 

<222> (97) . . (10395) 
<400> 1 

agtagttcgc ctgtgtgagc tgacaaactt agtagtgttt gtgaggatta acaacaatta 60 

acacagtgcg agctgtttct tagcacgaag atctcg atg tct aag aaa cca gga 114 

Met Ser Lys Lys Pro Gly 

1 5 

ggg ccc ggc aag age egg get gtc aat atg eta aaa cgc gga atg ccc 162 

Gly Pro Gly Lys Ser Arg Ala Val Asn Met Leu Lys Arg Gly Met Pro 

10 15 20 

cgc gtg ttg tec ttg att gga ctg aag agg get atg ttg age ctg ate 210 
Arg Val Leu Ser Leu lie Gly Leu Lys Arg Ala Met Leu Ser Leu lie 
25 30 35 

gac ggc aag ggg cca ata cga ttt gtg ttg get etc ttg gcg ttc ttc * 258 
Asp Gly Lys Gly Pro lie Arg Phe Val Leu Ala Leu Leu Ala Phe Phe 
40 45 50 

agg ttc aca gca att get ccg acc cga gca gtg ctg gat cga tgg aga 306 
Arg Phe Thr Ala He Ala Pro Thr Arg Ala Val Leu Asp Arg Trp Arg 
55 ■ 60 65 70 

ggt gtg aat aaa caa aca gcg atg aaa cac ctt ctg agt ttt aag aag 354 
Gly Val Asn Lys Gin Thr Ala Met Lys His Leu Leu Ser Phe Lys Lys 
75 80 85 
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gaa eta ggg acc ttg acc agt get ate aat egg egg age tea aaa caa 402 
Glu Leu Gly Thr Leu Thr Ser Ala He Asn Arg Arg Ser Ser Lys Gin 
90 95 100 

aag aaa aga gga gga aag acc gga act gca gtc atg att ggc ctg ate 450 
Lys Lys Arg Gly Glv Lys Thr Gly He Ala Val Met lie Gly Leu He 
105 J HO 115 

gee age gta gga gca gtt acc etc tec aac ttc caa ggg aacj gtg atg 4 98 
Ala Ser Val Gly Ala Val Thr Leu Ser Asn Phe Gin Gly Lys Val Met 
120 ' 125 130 

atg acg gca aac get act gac gtc aca gat gtc ate acg att cca aca 546 
Met Thr Val Asn Ala Thr Asp Val Thr Asp Val He Thr He Pro Thr 
135 140 145 150 

get get gga aag aac cca tgc att gtc aga gca atg gat gtg gga tac 594 
Ala Ala Giy Lys Asn Leu Cys He Val Arg Ala Met Asp Val Gly Tyr 
155 160 165 

atg tgc gat gat act ate act cat gaa tgc cca gtg ctg teg get ggt 642 
Met Cys Asp Asp Thr lie Thr Tyr Glu Cys Pro Val Leu Ser Ala Gly 
170 175 180 

aat gat cca gaa gac ate gac tgt tgg tgc aca aag tea gca gtc tac 690 
Asn Asp Pro Glu Asp He Asp Cys Trp Cys Thr Lys Ser Ala Val Tyr 
185 190 195 

gtc agg tat gga aga tgc acc aag aca cgc cac tea aga cgc agt egg 738 
Val Arg Tyr Gly Arg Cys Thr Lys Thr Arg His Ser Arg Arg Ser Arg 
200 205 210 



agg tea ctg aca gtg cag aca cac gga gaa age act eta gcg aac aag 
Arg Ser Leu Thr Val Gin Thr His Gly Glu Ser Thr Leu Ala Asn Lys 
215 220 225 230 



786 



aag ggg get tgg atg gac age acc aag gee aca agg tat ttg gta aaa 834 

Lys Gly Ala Trp Met Asp Ser Thr Lys Ala Thr Arg Tyr Leu Val Lys 
235 240 • 245 

aca gaa tea tgg ate ttg agg aac cct gga tat gee ctg gtg gca gee 882 

Thr Glu Ser Trp He Leu Arg Asn Pro Gly Tyr Ala Leu Val Ala Ala 
250 * 255 " 260 

gtc att ggt tgg atg ctt ggg age aac acc atg cag aga gtt gtg ttt 930 

Val He Gly Trp Met Leu Gly Ser Asn Thr Met Gin Arg Val Val Phe 

265 270 275 

gtc gtg eta ttg ctt ttg gtg gee cca get tac age ttt aac tgc ctt 978 

Val Val Leu Leu Leu Leu Val Ala Pro Ala Tyr Ser Phe Asn Cys Leu 
280 285 290 

gga atg age aac aga gac etc ttg gaa gga gtg tct gga gca aca tgg 1026 

Gly Met Ser Asn Arg Asp Phe Leu Glu Gly Val Ser Gly Ala Thr Trp 
295 300 305 310 

gtg gat ttg gtt etc gaa ggc gac age tgc gtg act ate atg tct aag 1074 

Val Asp Leu Val Leu Glu Gly Asp Ser Cys Val Thr He Met Ser Lys 
315 320 325 
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gac aag cct acc ate gat gtg aag atg atg aat atg gag gcg gec aac 1122 
Asp Lys Pro Thr lie Asp Val Lys Met Met Asn Met Glu Ala Ala Asn 
330 335 340 

ctg gca gag gtc cgc age tat tgc tat ttg get acc gtc age gat etc 1170 
Leu Ala Glu Val Arg Ser Tyr Cys Tyr Leu Ala Thr Val Ser Asp Leu 
345 350 355 

tec acc aaa get gcg tgc ccg acc atg gga gaa get cac aat gac aaa 1218 
Ser Thr Lys Ala Ala Cys Pro Thr Met Gly Glu Ala His Asn Asp Lys 
360 365 370 

cgt get gac cca get ttt gtg tgc aga caa gga gtg gtg gac agg ggc 1266 
Arg Ala Asp Pro Ala Phe Val Cys Arg Gin Gly Val Val Asp Arg Gly 
375 330 385 390 

tgg ggc aac ggc tgc gga eta ttt ggc aaa gga age att gac: aca tgc 1314 
Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Ser He Asp Thr Cys 
395 4 00 4 05 

gec aaa ttt gee tgc tct acc aag gca ata gga aga acc ate ttg aaa 1362 
Ala Lys Phe Ala Cys -Ser Thr Lys Ala He Gly Arg Thr He Leu Lys 
410 415 420 

gag aat ate aag tac gaa gtg gec att ttt gtc cat gga cca act act 1410 
Glu Asn He Lys Tyr Glu Val Ala He Phe Val His Gly Pro Thr Thr 
425 430 435 

gtg gag teg cac gga aac tac tec aca cag gtt gga gec act cag gca 1458 
Val Glu Ser His Gly Asn Tyr Ser Thr Gin Val Gly Ala Thr Gin Ala 
440 445 450 

ggg aga ttc age ate act cct gcg gcg cct tea tac aca eta aag ctt 1506 
Gly Arg Phe Ser He Thr Pro Ala Ala Pro Ser Tyr Thr Leu Lys Leu 
455 " 460 465 470 

gga gaa tat gga gag gtg aca gtg gac tgt gaa cca egg tea ggg att 1554 
Gly Glu Tvr Gly Glu Val Thr Val Asp Cys Glu Pro Arg Ser Gly He 
4 75 4 80 4 85 

gac acc aat gca tac tac gtg atg act gtt gga aca aag acg ttc ttg 1602 
Asp Thr Asn Ala Tyr Tyr Val Met Thr Val Gly Thr Lys Thr Phe Leu 
490 495 500 

gtc cat cgt gag tgg ttc atg gac etc aac etc cct tgg age agt get 1650 
Val His Arg Glu Trp Phe Met Asp Leu Asn Leu Pro Trp Ser Ser Ala 
505 1 510 515 



gga agt act gtg tgg agg aac aga gag acg tta atg gag ttt gag gaa 
Gly Ser Thr Val Trp Arg Asn Arg Glu Thr Leu Met Glu Phe Glu Glu 
520 525 530 



1698 



cca cac gee acg aag cag tct gtg ata gca ttg ggc tea caa gag gga 174 6 

Pro His Ala Thr Lys Gin Ser Val He Ala Leu Gly Ser Gin Glu Gly 

535 540 545 550 

get ctg cat caa get ttg get gga gee att cct gtg gaa ttt tea age 1794 

Ala Leu His Gin Ala Leu Ala Gly Ala He Pro Val Glu Phe Ser Ser 

555 560 565 



aac act gtc aag ttg acg teg ggt cac ztq aag tgt aga gtn aag atg 
Asn Thr Val Lys Leu Thr Ser Gly His Leu Lys Cys Arg Vai Lys Met 
570 575 580 
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1842 



gaa aaa ttg cag ttg aag gga aca acc cat ggc gtc tgt tea aag get 1890 
Glu Lys Leu Gin Leu Lys Gly Thr Thr Tyr Gly Val Cys Ser Lys Ala 
585 590 595 

ttc aag ttt ctt ggg act ccc gca gac aca ggt cac ggc act gtg gtg 1938 
Phe Lys Phe Leu Gly Thr Pro Ala Asp Thr Gly His Gly Thr Val Val 
600 605 610 

ttg gaa ttg cag tac acc ggc acg gat gga cct tgc aaa gtt cct ate 1986 
Leu Glu Leu Gin Tyr Thr Gly Thr Asp Gly Pro Cys Lys Val Pro He 
615 620 625 630 

teg tea gtg get tea ttg aac gac eta acg cca gtg ggc aga ttg gtc 2034 
Ser Ser Val Ala Ser Leu Asn Asp Leu Thr Pro Val Gly Arg Leu Val 
635 640 645 

act gtc aac cct ttt get tea gtg gcc acg gcc aac get aag gtc ctg 2082 
Thr Val Asn Pro Phe Val Ser Val Ala Thr Ala Asn Ala Lys Val Leu 
650 655 660 

att gaa ttg gaa cca ccc ttt gga cac tea tac ata gtg gtg ggc aga 2130 
He Glu Leu Glu Pro Pro Phe Gly Asp Ser Tyr He Val Vai Gly Arg 
665 670 675 

gga gaa caa cag att aat cac cat tgg cac aag tct gga age age att 2178 
Gly Glu Gin Gin He Asn His Kis Trp His Lys Ser Gly Ser Ser lie 
680 685 690 

ggc aaa gcc ttt aca acc acc etc aaa gga gcg cag aga eta gcc get 2226 
Gly Lys Ala Phe Thr Thr Thr Leu Lys Gly Ala Gin Arg Leu Ala Ala 
695 700 705 710 

eta gga gac aca get tgg gac ttt gga tea gtt gga ggg gtg ttc acc 2274 
Leu Gly Asp Thr Ala Trp Asp Phe Gly Ser Val Gly Gly Val Phe Thr 
715 720 725 

tea gtt ggg aag get gtc cat caa gtg ttc gga gga gca ttc cgc tea 2322 
Ser Val Gly Lys Ala Val His Gin Val Phe Gly Gly Ala Phe Arg Ser 
730 735 740 

ctg ttc gga ggc atg tec tgg ata acg caa gga ttg ctg ggg get etc 2370 
Leu Phe Gly Gly Met Ser Trp He Thr Gin Gly Leu Leu Gly Ala Leu 
745 ' 750 755 

ctg ttg tgg atg ggc ate aat get cgt gat agg tec ata get etc acg 2418 
Leu Leu Trp Met Gly He Asn Ala Arg Asp Arg Ser He Ala Leu Thr 
760 765 770 

ttt etc gca gtt gga gga gtt ctg etc ttc etc tec gtg aac gtg cac 2466 
Phe Leu Ala Val Gly Gly Val Leu Leu Phe Leu Ser Val Asn Val His 
775 780 785 790 

get gac act ggg tgt gcc ata gac ate age egg caa gag ctg aga tgt 2514 
Ala Asp Thr Gly Cys Ala He Asp lie Ser Arg Gin Glu Leu Arg Cys 
795 800 " 805 
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gga aat gga gtg ttc ata cac aat gat gtg gag get tgg atg gac egg 
Gly Asn Gly Val Phe lie His Asa Asp Val Glu Ala Trp Met Asp Arg 
810 315 820 



2562 



tac aag tat tac cct gaa acg cca caa ggc eta gee aag ate att cag 
Tyr Lys Tyr Tyr Pro Glu Thr Pro Gin Gly Leu Ala Lys lie lie Gin 
825 830 835 



2610 



aaa get cat aag gaa gga gtg tgc ggt eta cga tea gtt tec aga ctg 
Lys Ala His Lys Glu Gly Val Cys Gly Leu Arg Ser Val Ser Arg Leu 
840 845 850 . 



2658 



gag cat caa atg tgg gaa gca gtg aag gac gag ctg aac act ctt ttg 
Glu His Gin Met Trp Glu Ala Val Lys Asp Glu Leu Asn Thr Leu Leu 
855 860 365 870 



2706 



aag gag aat ggt gtg gac ctt agt gtc gtg gtt gag aaa cag gag gga 
Lys Glu Asn Gly Val Asp Leu Ser Val Val Val Glu Lys Gin Glu Gly 
875 380 885 



2754 



atg tac aag tea gca cct aaa cgc etc ace gee ace acg gaa aaa ttg 

Met Tyr Lys Ser Ala Pro Lys Arg Leu Thr Ala Thr Thr Glu Lys Leu 
890 895 900 

gaa att ggc tgg aag gee tgg gga aag agt att tta ttt gca cca gaa 

Glu He Gly Trp Lys Ala Trp Gly Lys Ser lie Leu Phe Ala Pro Glu 

905 * 910 915 



2802 



2850 



etc gee aac aac acc ttt gtg gtt gat ggt ccg gag acc aag gaa tgt 
Leu Ala Asn Asn Thr Phe Val Val Asp Gly Pro Glu Thr Lys Glu Cys 
920 925 930 



2898 



ccg act cag aat cgc get tgg aat age tta gaa gtg gag gat ttt gga 
Pro Thr Gin Asn Arg Ala Trp Asn Ser Leu Glu Val Glu Asp Phe Gly 
935 940 945 950 



2946 



ttt ggt etc acc age act egg atg ttc ctg aag gtc aga gag age aac 
Phe Gly Leu Thr Ser Thr Arg Met Phe Leu Lys Val Arg Glu Ser Asn 
955 960 965 



2994 



aca act gaa tgt gac teg aag ate att gga acg get gtc aag aac aac 
Thr Thr Glu Cys Asp Ser Lys He He Gly Thr Ala Val Lys Asn Asn 
970 975 980 



3042 



ttg gcg ate cac agt gac ctg tec tat tgg att gaa age agg etc aat 
Leu Ala He His Ser Asp Leu Ser Tyr Trp lie Glu Ser Arg Leu Asn 
985 990 995 



3090 



gat acg tgg aag ctt gaa agg gca gtt ctg ggt gaa gtc aaa tea tgt 
Asp Thr Trp Lys Leu Glu Arg Ala Val Leu Gly Glu Val Lys Ser Cys 
1000 1005 1010 



3138 



acg tgg cct gag acg cat acc ttg tgg ggc gat gga ate ctt gag agt 
Thr Trp Pro Glu Thr His Thr Leu Trp Gly Asp Gly He Leu Glu Ser 
1015 * 1020 1025 1030 



3186 



gac ttg ata ata cca gtc aca ctg gcg gga cca cga age aat cac aat 
Asp Leu He He Pro Val Thr Leu Ala Gly Pro Arg Ser Asn His Asn 
1035 1040 1045 



3234 
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169 



egg aga cct ggg tac aag aca caa aac cag ggc cca tgg gac gaa ggc 
Arg Arg Pro Gly Tyr Lys Thr Gin Asn Gin Gly Pro Trp Asp Glu Gly 
1050 1C55 1060 



3282 



egg gta gag ate gac ttc gat tac tgc cca gga act acg gtc acc ctg 
Arg Val Glu He Asp Phe Aso Tyr Cys Pro Gly Thr Thr Val Thr Leu 
1065 * 1070 1075 



3330 



age gag age tgc gga cac cgt gga ccc gee act cgc acc acc aca gag 
Ser Glu Ser Cys Gly His Arg Gly Pro Ala Thr Arg Thr Thr Thr Glu 
1080 1085 1090 



3378 



age gga aag ttg ata aca gat tgg tgc tgc agg age tgc acc tta cca 
Ser Gly Lys Leu He Thr Asp Trp Cys Cys Arg Ser Cys Thr Leu Pro 
1095 1100 1105 1110 



3426 



cca ctg cgc tac caa act gac age ggc tgt tgg tat ggt atg gag ate 
Pro Leu Arg Tyr Gin Thr Asp Ser Gly Cys Trp Tyr Gly Met Glu He 
1115 1120 1125 



3474 



aga cca cag aga cat gat gaa aag acc etc gtg cag tea caa gtg aat 
Arg Pro Gin Arg His Asp Glu Lys Thr Leu Val Gin Ser Gin Val Asn 
1130 1135 1140 



3522 



get tat aat get gat atg att gac cct ttt cag ttg ggc ctt ctg gtc 
Ala Tyr Asn Ala Asp Met He Asp Pro Phe Gin Leu Gly Leu Leu Val 
1145 1150 1155 



3570 



gtg ttc ttg gee acc cag gag gtc ctt cgc aag agg tgg aca gee aag 
Val Phe Leu Ala Thr Gin Glu Val Leu Arg Lys Arg Trp Thr Ala Lys 
1160 1165 1170 



3618 



ate age atg cca get ata ctg att get ctg eta gtc ctg gtg ttt ggg 
He Ser Met Pro Ala He Leu He Ala Leu Leu Val Leu Val Phe Gly 
1175 1180 1185 1190 



3666 



ggc att act tac act gat gtg tta cgc tat gtc ate ttg gtg ggg gca 
Gly He Thr Tyr Thr Asp Vai Leu Arg Tyr Val He Leu Val Gly Ala 
1195 1200 1205 



3714 



get ttc gca gaa tct aat teg gga gga gac gtg gta cac ttg gcg etc 
Ala Phe Ala Glu Ser Asn Ser Gly Gly Asp Val Val His Leu Ala Leu 
1210 1215 1220 



3762 



atg gcg acc ttc aag ata caa cca gtg ttt atg gtg gca teg ttt etc 
Met Ala Thr Phe Lys He Gin Pro Val Phe Met Val Ala Ser Phe Leu 
1225 1230 1235 



3810 



aaa gcg aga tgg acc aac cag gag aac att ttg ttg atg ttg gcg get 
Lys Ala Arg Trp Thr Asn Gin Glu Asn lie Leu Leu Met Leu Ala Ala 
1240 1245 1250 



3858 



gttttc ttt caa atg get tat cac gat gee cgc caa att ctg etc tgg 
Val Phe Phe Gin Met Ala Tyr His Asp Ala Arg Gin He Leu Leu Trp 
1255 1260 1265 1270 



3906 



gag ate cct gat gtg ttg aat tea ctg gcg gta get tgg atg ata ctg 
Glu He Pro Asp Val Leu Asn Ser Leu Ala Val Ala Trp Met He Leu 
1275 1280 1285 



3954 
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aga gcc ata aca ttc aca acg aca tea aat gtg gtc gtc ccg ctg eta 
Arg Ala He Thr Phe Thr Thr Thr Ser Asn Val Val Val Pro Leu Leu 
1290 1255 1300 



4002 



gcc ctg eta aca ccc egg ctg aga cgc ztg aat ctg gat gtg tac agg 
Ala Leu Leu Thr Pro Arg Leu Arg Cys Leu Asn Leu Asp Val Tyr Arg 
1305 1310 1315 



4050 



ata ctg ctg ttg atg gtc gga ata ggc age ttg ate agg gay aag agg 
He Leu Leu Leu Met Val Gly He Gly Ser Leu He Arg Giu Lys Arg 
1320 1325 1330 



4098 



agt gca get gca aaa aag aaa gga gca agt ctg eta tgc ttg get eta 
Ser Ala Ala Ala Lys Lys Lys Glv Ala Ser Leu Leu Cys Leu Ala Leu 
1335 1340 1345 1350 



4146 



gcc tea aca gga ctt ttc aac ccc atg ate ctt get get gga ctg att 
Ala Ser Thr Gly Leu Phe Asn Pro Met lie Leu Ala Ala Gly Leu He 
1355 1360 1365 



4194 



gca tgt gat ccc aac cgt aaa cgc gga tgg ccc gca act gaa gtg atg 
Ala Cys Asp Pro Asn Arg Lys Arg Gly Trp Pro Ala Thr Glu Val Met 
1370 1375 1380 



4242 



aca get gtc ggc eta atg ttt gcc ate gtc gga ggg ctg gca gag ctt 
Thr Ala Val Gly Leu Met Phe Ala He Val Gly Gly Leu Ala Glu Leu 
1385 1390 1395" 



4290 



gac att gac tec atg gcc att cca atg act ate gcg ggg etc atg ttt 
Asp lie Asp Ser Met Ala He Pro Met Thr lie Ala Gly Leu Met Phe 
^1400 1405 1410 



4338 



get get ttc gtg att tec ggg aaa tea aca gat atg tgg att gag aga 
Ala Ala Phe Val He Ser Gly Lys Ser Thr Asp Met Trp He Glu Arg 
1415 1420 1425 1430 



4386 



acg gcg gac att tec tgg gaa agt gat gca gaa att aca ggc teg age 
Thr Ala Asp lie Ser Trp Glu Ser Asp Ala Glu lie Thr Gly Ser Ser 
1435 1440 1445 



4434 



gaa aga gtt gat gtt egg ctt gat gat ggt gaa aac ttc cag etc atg 
Glu Arg Val Asp Val Arg Leu Asp Asp Gly Glu Asn Phe Gin Leu Met 
1450 1455 1460 



4482 



aat gat cca gga gca cct tgg aag ata tgg atg etc aga atg gtc tgt 
Asn Asp Pro Gly Ala Pro Trp Lys lie Trp Met Leu Arg Met Val Cys 
1465 1470 1475 



4530 



etc gcg att agt gcg tac ace ccc tgg gca ate ttg ccc tea gta gtt 
Leu Ala He Ser Ala Tyr Thr Pro Trp Ala lie Leu Pro Ser Val Val 
1480 1485 1490 



4578 



gga ttt tgg ata act etc caa tac aca aag aga gga ggt gtg ttg tgg 
Gly Phe Trp He Thr Leu Gin Tyr Thr Lys Arg Gly Gly Val Leu Trp 
1495 1500 1505 1510 



4626 



gac act ccc tea cca aag gag tac aaa aag ggg gac acg ace ace ggc 
Asp Thr Pro Ser Pro Lys Glu Tyr Lys Lys Gly Asp Thr Thr Thr Gly 
1515 1520 1525 



4674 
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gtc tac agg ate atg act cgt ggg ctg etc ggc agt tat caa gca gga 4722 
Val Tyr Arg He Met Thr Arg Gly Leu Leu Gly Ser Tyr Gin Ala Gly 
1530 1535 1540 

gcg ggc gtg atg gtt gaa ggt gtc ttc cac ace ctt tgg cat aca aca 4770 
Ala Gly Val Met Val Glu Gly Val Phe His Thr Leu Trp His Thr Thr 
1545 1550 1555 

aaa gga gec get ttg atg age gga gag ggc cgc ctg gac cca tac tgg 4818 
Lys Gly Ala Ala Leu Mec Ser Gly Glu Gly Arg Leu Asp Pro Tyr Trp 
1560 1565 1570 

ggc agt gtc aag gag gac cga ctt tgt tac gga gga ccc tgg aaa tzq 4866 
Gly Ser Val Lys Glu As? Arg Leu Cys Tyr Gly Gly Pro Trp Lys Leu 
1575 * 1580 1585 1590 

cag cac aag tgg aac ggg cag gat gag gtg cag atg att gtg gtg gaa 4914 
Gin His Lys Trp Asn Gly Gin Asp Glu Val Gin Met He Val Val Glu 
1595 1600 1605 

cct ggc aag aac gtt aag aac gec cag acg aaa cca ggg gtg ttc aaa 4962 
Pro Gly Lys Asn Val Lys Asn Val Gin Thr Lys Pro Gly Val Phe Lys 
1610 1615 1620 

aca cct gaa gga gaa ate ggg gec gtg act ttg gac ttc ccc act gga 5010 
Thr Pro Glu Gly Glu He Gly Ala Val Thr Leu Asp Phe Pro Thr Gly 
1625 1630 1635 



aca tea ggc tea cca ata gtg gac aaa aac ggt gat gtg att ggg ctt 
Thr Ser Gly Ser Pro He Val Asp Lys Asn Gly Asp Val lie Gly Leu 
1640 1645 1650 



5058 



tat ggc aat gga gtc ata atg ccc aac ggc tea tac ata age gcg ata 5106 
Tyr Gly Asn Gly Val He Met Pro Asn Gly Ser Tyr He Ser Ala He 
1655 1660 1665 1670 

gtg cag ggt gaa agg atg gat gag cca ate cca gee gga ttc gaa cct 5154 
Val Gin Gly Glu Arg Met Asp Glu Pro He Pro Ala Gly Phi* Glu Pro 
1675 1680 1685 

gag atg ctg agg aaa aaa cag ate act gta ctg gat etc cat ccc ggc 5202 
Glu Met Leu Arg Lys Lys Gin lie Thr Val Leu Asp Leu His Pro Gly 
1690 ' " ~ 1695 1700 

gee ggt aaa aca agg agg att ctg cca cag ate ate aaa gag gee ata 5250 
Ala Gly Lys Thr Arg Arg lie Leu Pro Gin He He Lys Glu Ala He 
1705 1710 1715 

aac aga aga ctg aga aca gee gtg eta gca cca ace agg gtt gtg get 5298 
.Asn Arg Arg Leu Arg Thr Ala Val Leu Ala Pro Thr Arg Val Val Ala 
1720 1725 1730 

get gag atg get gaa gca ctg aga gga ctg ccc ate egg tac cag aca 534 6 
Ala Glu Met Ala Glu Ala Leu Arg Gly Leu Pro lie Arg Tyr Gin Thr 
1735 1740 1745 1750 

tec gca gtg ccc aga gaa cat aat gga aat gag att gtt gat gtc atg 5394 
Ser Ala Val Pro Arg Glu His Asn Gly Asn Glu lie Val Asp Val Met 
1755 1760 1765 
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tgt cat get acc etc acc cac agg ctg atg tct cct cac agg gtg ccg 5442 
Cys His Ala Thr Leu Thr His Arg Leu Met Ser Pro His Arg Val Pro 
1770 1775 1780 

aac tac aac ctg ttc gtg atg gat gag get cat ttc acc gac cca get 5490 
Asn Tyr Asn Leu Phe Val Met Asp Glu Ala His Phe Thr Asp Pro Ala 
1785 1790 1795 

agt ate gca gca aga ggt tac act tec aca aag gtc gag eta ggg gag 5538 
Ser He Ala Ala Arg Gly Tyr He Ser Thr Lys Val Glu Leu Gly Glu 
1800 1305 1810 

gcg gcg gca ata ttc atg aca gec acc cca cca ggc act tea gat cca 5586 
Ala Ala Ala He Phe Met Thr Ala Thr Pro Pro Gly Thr Ser Asp Pro 
1815 1820 1825 1830 

ttc cca gag tec aat tea cca act tec gac tta cag act gag ate ccg 5634 
Phe Pro Glu Ser Asn Ser Pro He Ser Asp Leu Gin Thr Glu lie Pro 
1835 1840 1845 

gat cga get tgg aac tct gga tac gaa tgg ate aca gaa tac acc ggg 5682 
Asp Arg Ala Trp Asn Ser Gly Tyr Glu Trp He Thr Glu Tyr Thr Gly 
1850 1855 1860 

aag acg gtt tgg ttt gtg cct agt gtc aag atg ggg aat gag att gec 5730 
Lys Thr Val Trp Phe Val Pro Ser Val Lys Met Gly Asn Glu He Ala 
1865 1870 1875 

ctt tgc eta caa cgt get gga aag aaa gta gtc caa ttg aac aga aag 5778 
Leu Cys Leu Gin Arg Ala Gly Lys Lys Val Val Gin Leu Asn Arg Lys 
1880 1885 1890 

teg tac gag acg gag tac cca aaa tgt aag aac gat gat tgg gac ttt 5826 
Ser Tyr Glu Thr Glu Tyr Pro Lys Cys Lys Asn Asp Asp Trp Asp Phe 
1895 1900 1905 1910 

gtt ate aca aca gac ata tct gaa atg ggg get aac ttc aag gcg age 5874 
Val He Thr Thr Asp He Ser Glu Met Gly Ala Asn Phe Lys Ala Ser • 
1915 1920 1925 

agg gtg att gac age egg aag agt gtg aaa cca acc ate ata aca gaa 5922 
Arg Val He Asp Ser Arg Lys Ser Val Lys Pro Thr He He Thr Giu 
1930 1935 1940 

gga gaa ggg aga gtg ate ctg gga gaa cca tct gca gtg aca gca get 5970 
Gly Glu Gly Arg Val He Leu Gly Glu Pro Ser Ala Val Thr Ala Ala 
1945 " 1950 1955 

agt gec gee cag aga cgt gga cgt ate ggt aga aat ccg teg caa gtt 6018 
Ser Ala Ala Gin Arg Arg Gly Arg He Gly Arg Asn Pro Ser Gin Val 
1960 1965 1970 



ggt gat gag tac tgc tat ggg ggg cac acg aat gaa gac gac teg aac 
Gly Asp Glu Tyr Cys Tyr Gly Gly His Thr Asn Glu Asp Asp Ser Asn 
1975 1980 1985 1990 



6066 



ttc gee cat tgg act gag gca cga ate atg ccg gac aac ate aac atg 6114 
Phe Ala His Trp Thr Glu Ala Arg He Met Pro Asp Asn He Asn Met 
1995 2000 2005 
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cca aac gga ctg ate get caa ttc tac caa cca gag cgt gag aag gta 6162 
Pro Asn Gly Leu lie Ala Gin Phe Tyr Gin Pro Glu Arg Glu Lys Val 
2010 2015 2020 

tat acc atg gag ggg gaa tac egg etc aga gga gaa gag agg aaa aac 6210 
Tyr Thr Met Glu Gly Glu Tyr Arg Leu Arg Gly Glu Glu Arg Lys Asn 
2025 2030 2035 

ttt ctg gaa ctg ttg agg act gca gat ctg cca gtt tgg ctg get tac 6258 
Phe Leu Glu Leu Leu Arg Thr Ala Asp Leu Pro Val Trp Leu Ala Tyr 
2040 2045 2050 

aag gtt gca gcg get gga gtg tea tac cac gac egg agg tgg tgc ttt 6306 
Lys Val Ala Ala Ala Gly Val Ser Tyr His Asp Arg Arg Trp Cys Phe 
2055 2060 2065 2070 

gat ggt cct agg aca aac aca att tta gaa gac aac aac gaa gtg gaa 6354 
Asp Gly Pro Arg Thr Asn Thr lie Leu Glu Asp Asn Asn Glu Val Glu 
2075 2080 2085 

gtc ate acg aag ctt ggt gaa agg aag att ctg agg ccg cgc tgg att 6402 
Val lie Thr Lys Leu Gly Glu Arg Lys He Leu Arg Pro Arg Trp He 
2090 2095 2100 

gac gee agg gtg tac teg gat cac cag gca eta aag gcg ttc aag gac 6450 
Asp Ala Arg Val Tyr Ser Asp His Gin Ala Leu Lys Ala Phe Lys Asp 
2105 2110 2115 

ttc gee teg gga aaa cgt tct cag ata ggg etc att gag gtt ctg gga 6498 
Phe Ala Ser Gly Lys Arg Ser Gin lie Gly Leu He Glu Val Leu Gly 
2120 2125 2130 

aag atg cct gag cac ttc atg ggg aag aca tgg gaa gca ctt gac acc 654 6 
Lys Met Pro Glu His Phe Met Gly Lys Thr Trp Glu Ala Leu Asp Thr 
2135 2140 2145 2150 

atg tac gtt gtg gec act gca gag aaa gga gga aga get cac aga atg 6594 
Met Tyr Val Val Ala Thr Ala Glu Lys Gly Gly Arg Ala His Arg Met 
2155 2160 2165 

gee ctg gag gaa ctg cca gat get ctt cag aca att gee ttg att gee 6642 
Ala Leu Glu Glu Leu Pro Asp Ala Leu Gin Thr He Ala Leu He Ala 
2170 2175 2180 

tta ttg agt gtg atg acc atg gga gta ttc ttc etc etc atg cag egg 6690 
Leu Leu Ser Val Met Thr Met Gly Val Phe Phe Leu Leu Met Gin Arg 
2185 2190 2195 

aag ggc att gga aag ata ggt ttg gga ggc get gtc ttg gga gtc gcg 6738 
Lys Gly He Gly Lys He Gly Leu Gly Gly Ala Val Leu Gly Val Ala 
2200 2205 2210 

acc ttt ttc tgt tgg atg get gaa gtt cca gga acg aag ate gee gga 6786 
Thr Phe Phe Cys Trp Met Ala Glu Val Pro Gly Thr Lys He Ala Gly 
2215 2220 2225 2230 

atg ttg ctg etc tec ctt etc ttg atg att gtg eta att cct gag cca 6834 
Met Leu Leu Leu Ser Leu Leu Leu Met He Val Leu He Pro Glu Pro 
2235 2240 2245 
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gag aag caa cgt teg cag aca gac aac cag eta gec gtg ttc ctg att 6882 
Glu Lys Gin Arg Ser Gin Thr Asp Asn Gin Leu Ala Val Phe Leu He 
2250 2255 2260 

tgt gtc atg acc ctt gtg age gca gtg gca gec aac gag atg ggt tgg 6930 
Cys Val Met Thr Leu Val Ser Ala Val Ala Ala Asn Glu Met Gly Trp 
2265 2270 2275 

eta gac aag acc aag age gac ata acc agt ttg ttt ggg caa aga att 6978 
Leu Asp Lys Thr Lys Ser Asp lie Ser Ser Leu Phe Gly Gin Arg He 
2280 2285 2290 

gag gtc aag gag aat ttc age atg gga gag ttt ctt ctg gac ttg agg 7026 
Glu Val Lys Glu Asn Phe Ser Met Gly Glu Phe Leu Leu Asp Leu Arg 
2295 2300 2305 2310 

ccg gca aca gec tgg tea ctg tac get gtg aca aca gcg gtc etc act 7074 
Pro Ala Thr Ala Trp Ser Leu Tyr Ala Val Thr Thr Ala Val Leu Thr 
2315 2320 2325 

cca ctg eta aag cat ttg ate acg tea gat tac ate aac acc tea ttg 7122 
Pro Leu Leu Lys His Leu He Thr Ser Asp Tyr He Asn Thr Ser Leu 
2330 2335 2340 

acc tea ata aac gtt cag gca agt gca eta ttc aca etc gcg cga ggc 7170 
Thr Ser He Asn Val Gin Ala Ser Ala Leu Phe Thr Leu Ala Arg Gly 
2345 2350 2355 

ttc ccc ttc gtc gat gtt gga gtg teg get etc ctg eta gca gee gga 7218 
Phe Pro Phe Val Asp Val Gly Val Ser Ala Leu Leu Leu Ala Ala Gly 
2360 2365 2370 

tgc tgg gga caa gtc acc etc acc gtt acg gta aca gcg gca aca etc 7266 
Cys Trp Gly Gin Val Thr Leu Thr Val Thr Val Thr Ala Ala Thr Leu 
2375 " 2380 2385 2390 

ctt ttt tgc cac tat gec tac atg gtt ccc ggt tgg caa get gag gca 7314 
Leu Phe Cys His Tyr Ala Tyr Met Val Pro Gly Trp Gin Ala Glu Ala 
2395 2400 2405 

atg cgc tea gee cag egg egg aca gcg gee gga ate atg aaa aac get 7362 
Met Arg Ser Ala Gin Arg Arg Thr Ala Ala Gly He Met Lys Asn Ala 
2410 2415 2420 

gta gtg gat ggc ate gtg gee acg gac gtc cca gaa tta gag cgc acc 7410 
Val Val Asp Gly He Val Ala Thr Asp Val Pro Glu Leu Glu Arg Thr 
2425 2430 2435 

aca ccc ate atg cag aag aaa gtt gga cag ate atg ctg ate ttg gtg 7458 
Thr Pro lie Met Gin Lys Lys Val Gly Gin He Met Leu He Leu Val 
2440 2445 2450 

tct eta get gca gta gta gtg aac ccg tct gtg aag aca gta cga gaa 7506 
Ser Leu Ala Ala Val Val Val Asn Pro Ser Val Lys Thr Val Arg Glu 
2455 2460 2465 2470 

gee gga att ttg ate acg gee gca gcg gtg acg ctt tgg gag aat gga 7554 
Ala Gly He Leu He Thr Ala Ala Ala Val Thr Leu Trp Glu Asn Gly 
2475 2480 2485 
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gca age tct gtt tgg aac gca aca act gec ate gga etc tgc cac ate 7602 
Ala Ser Ser Val Trp Asn Ala Thr Thr Ala lie Gly Leu Cys His He 
2490 2495 2500 

atg cgt ggg ggt tgg ttg tea tgc eta :cc ata aca tgg aca etc ata 7650 
Met Arg Gly Gly Trp Leu Ser Cys Leu Ser He Thr Trp Thr Leu He 
2505 2510 2515 

aag aac atg gaa aaa cca gga eta aaa aga ggt ggg gca aaa gga cgc 7698 
Lys Asn Met Glu Lys Pro Gly Leu Lys Arg Gly Gly Ala Lys Gly Arg 
2520 2525 2530 

acc ttg gga gag gtt tgg aaa gaa aga etc aac cag atg aca aaa gaa 774 6 
Thr Leu Gly Glu Val Trp Lys Glu Arg Leu Asn Gin Met Thr Lys Glu 
2535 2540 2545 2550 

gag ttc act agg tac cgc aaa gag gec ate ate gaa gtc gat cgc tea 7794 
Glu Phe Thr Arg Tyr Arc Lys Glu Ala He He Glu Val Asp Arg Ser 
2555 2560 2565 

gcg gca aaa cac gec agg aaa gaa ggc aat gtc act gga ggg cat. tea 7842 
Ala Ala Lys His Ala Arg Lys Glu Gly Asn Val Thr Gly Gly His Ser 
2570 2575 2580 

gtc tct agg ggc aca gca aaa ctg aga tgg ctg gtc gaa egg agg ttt 7890 
Val Ser Arg Gly Thr Ala Lys Leu Arg Trp Leu Val Glu Arg Arg Phe 
2585 2590 2595 

etc gaa ccg gtc gga aaa gtg att gac ctt gga tgt gga aga ggc ggt 7938 
Leu Glu Pro Val Gly Lys Val lie Asp Leu Gly Cys Gly Arg Gly Gly 
2600 2605 2610 

tgg tgt tac tat atg gca acc caa aaa aga gtc caa gaa gtc aga ggg 7986 
Trp Cys Tyr Tyr Met Ala Thr Gin Lys Arg Val Gin Glu Val Arg Gly 
2615 2620 2625 2630 

tac aca aag ggc ggt ccc gga cat gaa gag ccc caa eta gtg caa agt 8034 
Tyr Thr Lys Gly Gly Pro Gly His Glu Glu Pro Gin Leu Val Gin Ser 
2635 2640 2645 

tat gga tgg aac att gtc acc atg aag agt gga gtg gat gtg ttc tac 8082 
Tyr Gly Trp Asn lie Val Thr Met Lys Ser Gly Val Asp Val Phe Tyr 
2650 2655 2660 

aga cct tct gag tgt tgt gac acc etc ctt tgt gac ate gga gag tec 8130 
Arg Pro Ser Glu Cys Cys Asp Thr Leu Leu Cys Asp He Gly Glu Ser 
2665 2670 2675 

teg tea agt get gag gtt gaa gag cat agg acg att cgt gtc ctt gaa 8178 
Ser Ser Ser Ala Glu Val Glu Glu His Arg Thr He Arg Val Leu Glu 
2680 2685 2690 

atg gtt gag gac tgg ctg cac cga ggg cca agg gaa ttt tgc gtg aag 8226 
Met Val Glu Asp Trp Leu His Arg Gly Pro Arg Glu Phe Cys Val Lys 
2695 2700 2705 2710 

gtg etc tgc ccc tac atg ccg aaa gtc ata gag aag atg gag ctg etc 8274 
Val Leu Cys Pro Tyr Met Pro Lys Val He Glu Lys Met Glu Leu Leu 
2715 2720 2725 
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caa cgc egg tat ggg ggg gga ctg gtc aga aac cca etc tea egg aat 
Gin Arg Arg Tyr Gly Gly Giy Leu Vai Arg Asn Pro Leu Ser Arg Asn 
2730 2735 2740 



8322 



tec acg cac gag atg tat tgg gtg age cga get tea ggc aat gtg gta 
Ser Thr His Glu Met Tyr Trp Val Ser Arg Ala Ser Gly Asn Val Val 
2745 2750 2755 



8370 



cat tea gtg aat atg ace age cag gtg etc eta gga aga atg gaa aaa 
His Ser Val Asn Met Thr Ser Gin Val Leu Leu Gly Arg Met Glu Lys 
2760 2765 2770 



8418 



agg acc tgg aag gga ccc caa tac gag gaa gat gta aac ttg gga age 
Arg Thr Trp Lys Gly Pro Gin Tyr Glu Glu Asp Val Asn Leu Gly Ser 
2775 2780 2735 2790 



8466 



gga acc agg gcg gtg gga aaa ccc ctg etc aac tea gac acc agt aaa 
Gly Thr Arg Ala Val Gly Lys Pro Leu Leu Asn Ser Asp Thr Ser Lys 
2795 2800 2805 

ate aac aac agg att gaa cga etc agg cgt gag tac agt teg acg tgg 
lie Asn Asn Arg lie Glu Arg Leu Arg Arg Glu Tyr Ser Ser Thr Trp 
2810 2815 2820 



8514- 



8562 



cac cac gat gag aac cac cca tat aga acc tgg aac tat cac ggc agt 
His His Asp Glu Asn His Pro Tyr Arg Thr Trp Asn Tyr His Gly Ser 
2825 2830 2835 



8610 



cat gat gtg aag ccc aca ggc tec gee agt teg ctg gtc aat gga gtg 
Tyr Asp Val Lys Pro Thr Gly Ser Ala Ser Ser Leu Val Asn Gly Val 
2840 • 2845 2850 



8658 



gtc agg etc etc tea aaa cca tgg gac acc ate acg aat gtt acc acc 
Val Arg Leu Leu Ser Lys Pro Trp Asp Thr lie Thr Asn Val Thr Thr 
2855 ' 2860 2865 2870 



8706 



atg gee atg act gac act act ccc ttc ggg cag cag cga gtg ttc aaa 
Met Ala Met Thr Asp Thr Thr Pro Phe Gly Gin Gin Arg Val Phe Lys 
2875 2880 2885 



8754 



gag aag gtg gac acg aaa get cct gaa ccg cca gaa gga gcg aag tac 
Glu Lys Val Asp Thr Lys Ala Pro Glu Pro Pro Glu Gly Ala Lys Tyr 
2890 2895 2900 



8802 



gtg etc aac gag acc acc aac tgg ttg tgg gcg ttt ttg gee aga gaa 
Val Leu Asn Glu Thr Thr Asn Trp Leu Trp Ala Phe Leu Ala Arg Glu 
2905 2910 2915 



8850 



aaa cgt ccc aga atg tgc tct cga gag gaa ttc ata aga aag gtc aac 
Lys Arg Pro Arg Met Cys Ser Arg Glu Glu Phe lie Arg Lys Val Asn 
2920 2925 2930 



8898 



age aat gca get ttg ggt gee atg ttt gaa gag cag aat caa tgg agg 
Ser Asn Ala Ala Leu Gly Ala Met Phe Glu Glu Gin Asn Gin Trp Arg 
2935 2940 2945 2950 



8946 



age gee aga gaa gca gtt gaa gat cca aaa ttt tgg gag atg gtg gat 
Ser Ala Arg Glu Ala Val Glu Asp Pro Lys Phe Trp Glu Met Val Asp 
2955 2960 2965 



8994 
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gag gag cgc gag gca cat ctg egg ggg gaa tgt cac act tgc; att tac 904 2 
Glu Glu Arg Glu Ala His Leu Arg Gly Giu Cys His Thr Cys He Tyr 
2970 2975 2980 

aac atg atg gga aag aga gag aaa aaa ccc gga gag ttc gga aag gec 9090 
Asn Met Met Gly Lys Arg Glu Lys Lys Pro Gly Glu ?he Gly Lys Ala 
2985 2990 2995 

aag gga age aga gec att tgg ttc atg tgg etc gga get cgc ttt ctg 9138 
Lys Gly Ser Arg Ala He Trp Phe Met Trp Leu Gly Ala Arg Phe Leu 
3000 3005 3010 

gag ttc gag get ctg ggt ttt ccc aat gaa gac cac tgg ctt gga aga 9186 
Glu Phe Glu Ala Leu Gly Phe Leu Asn Glu Asp His Trp Leu Gly Arg 
3015 3020 3025 3030 

aag aac tea gga gga ggt gtc gag ggc ttg ggc etc caa aaa ctg ggt 9234 
Lys Asn Ser Gly Gly Gly Val Glu Gly Leu Gly Leu Gin Lys Leu Gly 
3035 3040 3045 

tac ate ctg cgt gaa gtt ggc acc egg cct ggg ggc aag ate tat get 9282 
Tyr He Leu Arg Glu Val Gly Thr Arg Pro Gly Gly Lys He Tyr Ala 
3050 3055 3060 

gat gac aca get ggc tgg gac acc cgc ate acg aga get gac ttg gaa 9330 
Asp Asp Thr Ala Gly Trp Asp Thr Arg lie Thr Arg Ala Asp Leu Glu 
3065 3070 3075 

aat gaa get aag gtg ctt gag ctg ctt gat ggg gaa cat egg cgt ctt 9378 
Asn Glu Ala Lys Val Leu Glu Leu Leu Asp Gly Glu His Arg Arg Leu 
3080 3085 3090 

gec agg gec ate att gag etc acc tat cgt cac aaa gtt gtg aaa gtg 9426 
Ala Arg Ala He He Glu Leu Thr Tyr Arg His Lys Val Val Lys Val 
3095 3100 3105 3110 

atg cgc ccg get get gat gga aga acc gtc atg gat gtt ate tec aga 9474 
Met Arg Pro Ala Ala Asp Gly Arg Thr Val Met Asp Val He Ser Arg 
3115 3120 3125 

gaa gat cag agg ggg agt gga caa gtt gtc acc tac gec eta aac act 9522 
Glu Asp Gin Arg Gly Ser Gly Gin Val Val Thr Tyr Ala Leu Asn Thr 
3130 3135 3140 

ttc acc aac ctg gec gtc cag ctg gtg agg atg atg gaa ggg gaa gga 9570 
Phe Thr Asn Leu Ala Val Gin Leu Val Arg Met Met Glu Gly Glu Gly 
3145 3150 3155 

gtg att ggc cca gat gat gtg gag aaa etc aca aaa ggg aaa gga ccc 9618 
Val He Gly Pro Asp Asp Val Glu Lys Leu Thr Lys Gly Lys Gly Pro 
3160 3165 3170 

aaa gtc agg acc tgg ctg ttt gag aat ggg gaa gaa aga etc age cgc 9666 
Lys Val Arg Thr Trp Leu Phe Glu Asn Gly Glu Glu Arg Leu Ser Arg 
3175 3180 3185 3190 

atg get gtc agt gga gat gac tgt gtg gta aag ccc ctg gac gat cgc 9714 
Met Ala Val Ser Gly Asp Asp Cys Val Val Lys Pro Leu Asp Asp Arg 
3195 3200 3205 
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ttt gcc acc teg etc cac etc etc aat get atg tea aag get cgc aaa 
Phe Ala Thr Ser Leu His Phe Leu Asn Ala Met Ser Lys Val Arg Lys 
3210 3215 3220 



9762 



gac ate caa gag tgg aaa ccg tea act gga tgg tat gat tgg cag cag 
Asp He Gin Glu Trp Lys Pro Ser Thr Gly Trp Tyr Asp Trp Gin Gin 
3225 3230 3235 



9810 



gtt cca ttt tgc tea aac cat ttc act gaa ttg 'arc atg aaa gat gga 
Val Pro Phe Cys Ser Asn His Phe Thr Glu Leu He Met Lys Asp Gly 
3240 3245 3250 



9858 



aga aca ctg gtg gtt cca tgc cga gga cag gat gaa ttg gta ggc aga 
Arg Thr Leu Val Val Pro Cys Arg Gly Gin Asp Glu Leu Val Gly Arg 
3255 3260 3265 3270 



9906 



get cgc ata tct cca ggg gcc gga tgg aac gtc cgc gac act get tgt 
Ala Arg lie Ser Pro Gly Ala Gly Trp Asn Val Arg Asp Thr Ala Cys 
3275 3280 3285 



9954 



ctg get aag tct tat gcc cag atg tgg ctg ctt ctg tac ttc cac aga 
Leu Ala Lys Ser Tyr Ala Gin Met Trp Leu Leu Leu Tyr Phe His Arg 
3290 3295 3300 



10002 



aga gac ctg egg etc atg gcc aac gcc att tgc tec get gtc cct gtg 10050 
Arg Asp Leu Arg Leu Met Ala Asn Ala He Cys Ser Ala Val Pro Val 
3305 3310 3315 



aat tgg gtc cct acc gga aga acc acg tgg tec ate cat gca gga gga 
Asn Trp Val Pro Thr Gly Arg Thr Thr Trp Ser He His Ala Gly Gly 
3320 3325 3330 



10098 



gag tgg atg aca aca gag gac atg ttg gag gtc tgg aac cgt gtt tgg 
Glu Trp Met Thr Thr Glu Asp Met Leu Glu Val Trp Asn Arg Val Trp 
3335 3340 3345 3350 



10146 



ata gag gag aat gaa tgg atg gaa gac aaa acc cca gtg gag aaa tgg 
He Glu Glu Asn Glu Trp Met Glu Asp Lys Thr Pro Val Glu Lys Trp 
3355 3360 3365 



10194 



agt gac gtc cca tat tea gga aaa cga gag gac ate tgg tgt ggc age 
Ser Asp Val Pro Tyr Ser Gly Lys Arg Glu Asp He Trp Cys Gly Ser 
3370 3375 3380 



10242 



ctg att ggc aca aga gcc cga gcc acg tgg gca gaa aac ate cag gtg 
Leu He Gly Thr Arg Ala Arg Ala Thr Trp Ala Glu Asn He Gin Val 
3385 3390 3395 



10290 



get ate aac caa gtc aga gca ate ate gga gat gag aag tat gtg gat 
Ala He Asn Gin Val Arg Ala He He Gly Asp Glu Lys Tyr Val Asp 
3400 3405 3410 



10338 



tac atg agt tea eta aag aga tat gaa gac aca act ttg gtt gag gac 
Tyr Met Ser Ser Leu Lys Arg Tyr Glu Asp Thr Thr Leu Val Glu Asp 
3415 3420 3425 3430 



10386 



aca gta ctg tagatattta atcaattgta aatagacaat ataagtatgc 
Thr Val Leu 



10435 



ataaaagtgt agttttatag tagtatttag tggtgttagt gtaaatagtt aagaaaattt 10495 



* 
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tgaggagaaa gtcaggccgg gaagttcccg ccaccggaag ttgagtagac ggtgctgcct 10555 
gcgactcaac cccaggagga ctgggtcaac aaagccgcga agtgacccat gtaagccctc 10615 
agaaccgtct cggaaggagg accccacatg tcgtaacttc aaagcccaat gtcagaccac 10675 
gctacggcgt gccactctgc ggagagtgca gtctgcgata gtgccccagg aggactgggt 10735 
taacaaaggc aaaccaacgc cccacgcggc cctagccccg gtaatggtgt taaccagggc 10795 
gaaaggacta gaggttagag gagaccccgc ggtttaaagt gcacgcccca gcctgactga 10855 
agctgtaggt caggggaagg actagaggtt agtggagacc ccgtgccaca aaacaccaca 10915 
acaaaacagc atattgacac ctgggataga ctaggagatc ttctgctctg cacaaccagc 10975 
cacacggcac agtgcgccga caatggtggc tggtggtgcg agaacacagg atct 11029 

<210> 2 

<211> 3433 

<212> PRT 

<213> Flavivirus sp. 

<400> 2 

Met Ser Lys Lys Pro Gly Gly Pro Gly Lys Ser Arg Ala Val Asn Met 
1 5 10 15 

Leu Lys Arg Gly Met Pro Arg Val Leu Ser Leu lie Gly Leu Lys Arg 
20 25 30 

Ala Met Leu Ser Leu He Asp Gly Lys Gly Pro He Arg Phe Val Leu 
35 40 45 

Ala Leu Leu Ala Phe Phe Arg Phe Thr Ala He Ala Pro Thr Arg Ala 
50 55 60 

Val Leu Asp Arg Trp Arg Gly Val Asn Lys Gin Thr Ala Met Lys His 
65 " 70 75 80 

Leu Leu Ser Phe Lys Lys Glu Leu Gly Thr Leu Thr Ser Ala He Asn 
85 90 95 

Arg Arg Ser Ser Lys Gin Lys Lys Arg Gly Gly Lys Thr Gly lie Ala 
100 105 110 

Val Met He Gly Leu lie Ala Ser Val Gly Ala Val Thr Leu Ser Asn 
115 120 125 

Phe Gin Gly Lys Val Met Met Thr Val Asn Ala Thr Asp Val Thr Asp 
130 J 135 140 

Val lie Thr lie Pro Thr Ala Ala Gly Lys Asn Leu Cys lie Val Arg 
145 150 155 160 

Ala Met Asp Val Gly Tyr Met Cys Asp Asp Thr lie Thr Tyr Glu Cys 
165 170 175 

Pro Val Leu Ser Ala Gly Asn Asp Pro Glu Asp lie Asp Cys Trp Cys 
180 185 190 



WO 02/081741 




PCTy 




(169 



17/42 



Thr Lys Ser Ala Val Tyr Val Arg Tyr Gly Arg Cys Thr Lys Thr Arg 
195 * 200 205 

His Ser Arg Arg Ser Arg Arg Ser Leu Thr Val Gin Thr His Gly Glu 
210 " 215 220 

Ser Thr Leu Ala Asn Lys Lvs Gly Ala Trp Met Asp Ser Thr Lys Ala 
225 230 235 240 

Thr Arg Tyr Leu Val Lys Thr Glu Ser Trp He Leu Arg Asn Pro Gly 
245 250 255 

Tyr Ala Leu Val Ala Ala Val He Gly Trp Met Leu Gly Ser Asn Thr 
260 265 270 

Met Gin Arg Val Val ?he Val Val Leu Leu Leu Leu Val Ala Pro Ala 
275 280 285 

Tyr Ser Phe Asn Cys Leu Gly Met Ser Asn Airg Asp Phe Leu Glu Gly 
290 295 300 

Val Ser Gly Ala Thr Trp Val Asp Leu Val Leu Glu Gly Asp Ser Cys 
305 ' 310 315 320 

Val Thr He Mex: Ser Lys Asp Lys Pro Thr He Asp Val Lys Met Met 
325 330 335 

Asn Met Glu Ala Ala Asn Leu Ala Glu Val Arg Ser Tyr Cys Tyr Leu 
340 345 350 

Ala Thr Val Ser Asp Leu Ser Thr Lys Ala Ala Cys Pro Thr Met Gly 
355 360 365 

Glu Ala His Asn Asp Lys Arg Ala Asp Pro Ala Phe Val Cys Arg Gin 
370 375 380 

Gly Val Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys 
385 390 395 400 

Gly Ser He Asp Thr Cys Ala Lys Phe Ala Cys Ser Thr Lys Ala He 
405 410 415 

Gly Arg Thr He Leu Lys Glu Asn lie Lys Tyr Glu Val Ala He Phe 
420 425 430 

Val His Gly Pro Thr Thr Val Glu Ser His Gly Asn Tyr Ser Thr Gin 
435 440 445 

Val Gly Ala Thr Gin Ala Gly Arg Phe Ser He Thr Pro Ala Ala Pro 
450 455 460 

Ser Tyr Thr Leu Lys Leu Gly Glu Tyr Gly Glu Val Thr Val Asp Cys 
465 470 475 480 

Glu Pro Arg Ser Gly He Asp Thr Asn Ala Tyr Tyr Val Met Thr Val 



485 



490 



495 



Gly Thr Lys Thr Phe Leu Val His Arg Glu Trp Phe Met Asp Leu Asn 
500 505 510 
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Leu Pro Trp Ser Ser Ala Gly Ser Thr Val Trp Arg Asn Arg Glu Thr 
515 520 525 

Leu Met Glu Phe Glu Glu Pro His Ala Thr Lys Gin Ser Val lie Ala 
530 535 540 

Leu Gly Ser Gin Glu Gly Ala Leu His Gin Ala Leu Ala Gly Ala lie 
545 550 555 560 

Pro Val Glu Phe Ser Ser Asn Thr Val Lys Leu Thr Ser Gly His Leu 
565 570 575 

Lys Cys Arg Val Lys Met Glu Lys Leu Gin Leu Lys Gly Thr Thr Tyr 
580 585 590 

Gly Val Cys Ser Lys Ala Phe Lys Phe Leu Gly Thr Pro Ala Asp Thr 
595 600 605 

Gly His Gly Thr Val Val Leu Glu Leu Gin Tyr Thr Gly Thr Asp Gly 
610 615 620 

Pro Cys Lys Val Pro lie Ser Ser Val Ala Ser Leu Asn Asp Leu Thr 
625 630 635 640 

Pro Val Gly Arg Leu Val Thr Val Asn Pro Phe Val Ser Val Ala Thr 
645 650 655 

Ala Asn Ala Lys Val Leu lie Glu Leu Glu Pro Pro Phe Gly Asp Ser 
660 665 670 

Tyr lie Val Val Gly Arg Gly Glu Gin Gin He Asn His His Trp His 
675 680 685 

Lys Ser Gly Ser Ser He Gly Lys Ala Phe Thr Thr Thr Leu Lys Gly 
690 " 695 700 

Ala Gin Arg Leu Ala Ala Leu Gly Asp Thr Ala Trp Asp Phe Gly Ser 
705 710 715 720 

Val Gly Gly Val Phe Thr Ser Val Gly Lys Ala Val His Gin Val Phe 
725 730 735 

Gly Gly Ala Phe Arg Ser Leu Phe Gly Gly Met Ser Trp He Thr Gin 
740 745 750 

Gly Leu Leu Gly Ala Leu Leu Leu Trp Met Gly He Asn Ala Arg Asp 
755 760 765 

Arg Ser He Ala Leu Thr Phe Leu Ala Val Gly Gly Val Leu Leu Phe 
770 775 780 

Leu Ser Val Asn Val His Ala Asp Thr Gly Cys Ala He Asp He Ser 
785 790 795 800 

Arg Gin Glu Leu Arg Cys Gly Asn Gly Val Phe He His Asn Asp Val 



805 



810 



815 



Glu Ala Trp Met Asp Arg Tyr Lys Tyr Tyr Pro Glu Thr Pro Gin Gly 
820 825 830 



WO 02/081741 PCT/F 

19/42 

Leu Ala Lys lie He Gin Lys Ala His Lys Glu Gly Val Cys Gly Leu 
835 840 845 

Arg Ser Val Ser Arg Leu Glu His Gin Met Trp Glu Ala Val Lys Asp 
850 855 860 

Glu Leu Asn Thr Leu Leu Lys Glu Asn Gly Val Asp Leu Ser Val Val 
865 870 875 880 

Val Glu Lys Gin Glu Gly Met Tyr Lys Ser Ala Pro Lys Arg Leu Thr 
885 890 895 

Ala Thr Thr Glu Lys Leu Glu lie Gly Trp Lys Ala Trp Gly Lys Ser 
900 905 910 

He Leu Phe Ala Pro Glu Leu Ala Asn Asn Thr Phe Val Val Asp Gly 
915 920 925 

Pro Glu Thr Lys Glu Cys Pro Thr Gin Asn Arg Ala Trp Asn Ser Leu 
930 935 940 

Glu Val Glu Asp Phe Gly Phe Gly Leu Thr Ser Thr Arg Met Phe Leu 
945 950 955 960 

Lys Val Arg Glu Ser Asn Thr Thr Glu Cys Asp Ser Lys He He Gly 
965 970 975 

Thr Ala Val Lys Asn Asn Leu Ala He His Ser Asp Leu Ser Tyr Trp 
980 985 990 

He Glu Ser Arg Leu Asn Asp Thr Trp Lys Leu Glu Arg Ala Val Leu 
995 1000 1005 

Gly Glu Val Lys Ser Cys Thr Trp Pro Glu Thr His Thr Leu Trp Gly 
1010 1015 1020 

Asp Gly He Leu Glu Ser Asp Leu He He Pro Val Thr Leu Ala Gly 
025 1030 1035 1040 

Pro Arg Ser Asn His Asn Arg Arg Pro Gly Tyr Lys Thr Gin Asn Gin 
1045 1050 1055 

Gly Pro Trp Asp Glu Gly Arg Val Glu lie Asp Phe Asp Tyr Cys Pro 
1060 1065 1070 

Gly Thr Thr Val Thr Leu Ser Glu Ser Cys Gly His Arg Gly Pro Ala 
1075 1080 1085 

Thr Arg Thr Thr Thr Glu Ser Gly Lys Leu He Thr Asp Trp Cys Cys 
1090 1095 1100 

Arg Ser Cys Thr Leu Pro Pro Leu Arg Tyr Gin Thr Asp Ser Gly Cys 
105 " 1110 1115 1120 

Trp Tyr Gly Met Glu lie Arg Pro Gin Arg His Asp Glu Lys Thr Leu 
1125 1130 1135 

Val Gin Ser Gin Val Asn Ala Tyr Asn Ala Asp Met lie Asp Pro Phe 
1140 1145 1150 
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Gin Leu Gly Leu Leu Val Val Phe Leu Ala Thr Gin Glu Val Leu Arg 
1155 1160 1165 

Lys Arg Trp Thr Ala Lys lie Ser Met Pro Ala lie Leu lie Ala Leu 
1170 ' 1175 1180 

Leu Val Leu Val Phe Gly Gly lie Thr Tyr Thr Asp Val Leu Arg Tyr 
185 1190 1195 1200 

Val He Leu Val Gly Ala Ala Phe Ala Glu Ser Asn Ser Gly Gly Asp 
1205 1210 1215 

Val Val His Leu Ala Leu Met Ala Thr Phe Lys lie Gin Pro Val Phe 
1220 1225 1230 

Met Val Ala Ser Phe Leu Lys Ala Arg Trp Thr Asn Gin Glu Asn lie 
1235 1240 1245 

Leu Leu Met Leu Ala Ala Val Phe Phe Gin Met Ala Tyr His Asp Ala 
1250 1255 1260 

Arg Gin He Leu Leu Trp Glu He Pro Asp Val Leu Asn Ser Leu Ala 
265 1270 1275 1280 

Val Ala Trp Met He Leu Arg Ala He Thr Phe Thr Thr Thr Ser Asn 
1285 1290 1295 

Val Val Val Pro Leu Leu Ala Leu Leu Thr Pro Arg Leu Arg Cys Leu 
1300 1305 1310 

Asn Leu Asp Val Tyr Arg He Leu Leu Leu Met Val Gly He Gly Ser 
1315 1320 1325 

Leu He Arg Glu Lys Arg Ser Ala Ala Ala Lys Lys Lys Gly Ala Ser 
1330 1335 1340 

Leu Leu Cys Leu Ala Leu Ala Ser Thr Gly Leu Phe Asn Pro Met He 
34*5 13,50 1355 1360 

Leu Ala Ala Gly Leu He Ala Cys Asp Pro Asn Arg Lys Arg Gly Trp 
1365 1370 1375 

Pro Ala Thr Glu Val Met Thr Ala Val Gly Leu Met Phe Ala He Val 
1380 1385 1390 

Gly Gly Leu Ala Glu Leu Asp He Asp Ser Met Ala He Pro Met Thr 
1395 1400 1405 

He Ala Gly Leu Met Phe Ala Ala Phe Val He Ser Gly Lys Ser Thr 
1410 1415 1420 

Asp Met Trp He Glu Arg Thr Ala Asp He Ser Trp Glu Ser Asp Ala 
425 " 1430 1435 1440 

Glu He Thr Gly Ser Ser Glu Arg Val Asp Val Arg Leu Asp Asp Gly 
1445 1450 1455 



Glu Asn Phe Gin Leu Met Asn Asp Pro Gly Ala Pro Trp Lys He Trp 
1460 1465 1470 



PCT 
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Met Leu Arg Met Val Cys Leu Ala He Ser Ala Tyr Thr Pro Trp Ala 
1475 1480 1485 

He Leu Pro Ser Val Val Gly Phe Trp He Thr Leu Gin Tyr Thr Lys 
1490 1495 1500 

Arg Gly Gly Val Leu Trp Asp Thr Pro Ser Pro Lys Glu Tyr Lys Lys 
505 1510 1515 1520 

Gly Aso Thr Thr Thr Gly Val Tyr Arg lie Met Thr Arg Gly Leu Leu 
1525 1530 1535 

Gly Ser Tyr Gin Ala Gly Ala Gly Val Met Val Glu Gly Val Phe His 
1540 1545 1550 

Thr Leu Trp His Thr Thr Lys Gly Ala Ala Leu Met Ser Giy Glu Gly 
1555 1560 1565 

Arg Leu Asp Pro Tyr Trp Gly Ser Val Lys Glu Asp Arg Leu Cys Tyr 
1570 * ~ 1575 1580 

Giy Gly Pro Trp Lys Leu Gin His Lys Trp Asn Gly Gin Asp Glu Val 
585 1590 1595 1600 

Gin Met He Val Val Glu Pro Gly Lys Asn Val Lys Asn Val Gin Thr 
1605 1610 1615 

Lys Pro Gly Val Phe Lys Thr Pro Glu Gly Glu He Gly Ala Val Thr 
1620 1625 1630 

Leu Asp Phe Pro Thr Gly Thr Ser Gly Ser Pro He Val Asp Lys Asn 
1635 1640 1645 

Gly Asp Val I^e Gly Leu Tyr Gly Asn Gly Val He Met Pro Asn Gly 
1650 1655 1660 

Ser Tyr He Ser Ala He Val Gin Gly Glu Arg Met Asp Glu Pro He 
665 1670 1675 1680 

Pro Ala Gly Phe Glu Pro Glu Met Leu Arg Lys Lys Gin He Thr Val 
1685 1690 ' 1695 

Leu Asp Leu His Pro Gly Ala Gly Lys Thr Arg Arg He Leu Pro Gin 
1700 1705 1710 

lie He Lys Glu Ala He Asn Arg Arg Leu Arg Thr Ala Val Leu Ala 
1715 1720 1725 

Pro Thr Arg Val Val Ala Ala Glu Met Ala Glu Ala Leu Arg Gly Leu 
1730 1735 1740 

Pro He Arg Tyr Gin Thr Ser Ala Val Pro Arg Glu His Asn Gly Asn 
745 1750 1755 1760 

Glu He Val Asp Val Met Cys His Ala Thr Leu Thr His Arg Leu Met 
1765 1770 1775 



Ser Pro His Arg Val Pro Asn Tyr Asn Leu Phe Val Met Asp Glu Ala 
1780 1785 1790 



# I 

PCT/FlU 
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His Phe Thr Asp Pro Ala Ser He Ala Ala Arg Gly Tyr lie Ser Thr 
1795 1800 1805 

Lys Val Glu Leu Gly Glu Ala Ala Ala He Phe Met Thr Ala Thr Pro 
1810 1815 1820 

Pro Gly Thr Ser Asp Pro Phe Pro Glu Ser Asn Ser Pro He Ser Asp 
825 1830 1835 1840 

Leu Gin Thr Glu He Pro Asp Arg Ala Trp Asn Ser Gly Tyr Glu Trp 
1845 1850 1855 

lie Thr Glu Tyr Thr Gly Lys Thr Val Trp Phe Val Pro Ser Val Lys 
1860 1865 1870 

Met Gly Asn Glu He Ala Leu Cys Leu Gin Arg Ala Gly Lys Lys Val 
1875 1880 1885 

Val Gin Leu Asn Arg Lys Ser Tyr Glu Thr Glu Tyr Pro Lys Cys Lys 
1890 1895 1900 

Asn Asp Asp Trp Asp Phe Val He Thr Thr Asp He Ser Glu Met Gly 
905 ' 1910 1915 1920 

Ala Asn Phe Lys Ala Ser Arg Val He Asp Ser Arg Lys Ser Val Lys 
1925 1930 1935 

Pro Thr He He Thr Glu Gly Glu Gly Arg Val He Leu Gly Glu Pro 
1940 1945 1950 

Ser Ala Val Thr Ala Ala Ser Ala Ala Gin Arg Arg Gly Arg He Gly 
1955 • 1960 1965 

Arg Asn Pro Ser Gin Val Gly Asp Glu Tyr Cys Tyr Gly Gly His Thr 
1970 1975 1980 

Asn Glu Asp Asp Ser Asn Phe Ala His Trp Thr Glu Ala Arg He Met 
985 1990 1995 2000 

Pro Asp Asn He Asn Met Pro Asn Gly Leu He Ala Gin Phe Tyr Gin 
2005 2010 2015 

Pro Glu Arg Glu Lys Val Tyr Thr Met Glu Gly Glu Tyr Arg Leu Arg 
2020 2025 2030 

Gly Glu Glu Arg Lys Asn Phe Leu Glu Leu Leu Arg Thr Ala Asp Leu 
2035 2040 2045 

Pro Val Trp Leu Ala Tyr Lys Val Ala Ala Ala Gly Val Ser Tyr His 
2050 2055 2060 

Asp Arg Arg Trp Cys Phe Asp Gly Pro Arg Thr Asn Thr He Leu Glu 
065 " 2070 2075 2080 

Asp Asn Asn Glu Val Glu Val He Thr Lys Leu Gly Glu Arg Lys He 
2085 2090 2095 



Leu Arg Pro Arg Trp He Asp Ala Arg Val Tyr Ser Asp His Gin Ala 
2100 2105 2110 
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Leu Lys Ala Phe Lys Asp Phe Ala Ser Gly Lys Arg Ser Gin lie Gly 
2115 2120 2125 

Leu He Glu Val Leu Gly Lys Met Pro Glu His Phe Met Gly Lys Thr 
2130 2135 2140 

Trp Glu Ala Leu Asp Thr Met Tyr Val Val Ala Thr Ala Glu Lys Gly 
145 2150 2155 2160 

Gly Arg Ala His Arg Met Ala Leu Glu Glu Leu Pro Asp Ala Leu Gin 
2165 2170 2175 

Thr He Ala Leu He Ala Leu Leu Ser Val Met Thr Met Gly Val Phe 
2180 2185 2190 

Phe Leu Leu Met Gin Arg Lys Gly He Gly Lys He Gly Leu Gly Gly 
2195 2200 2205 

Ala Val Leu Gly Val Ala Thr Phe Phe Cys Trp Met Ala Glu Val Pro 
2210 2215 2220 

Gly Thr Lys He Ala Gly Met Leu Leu Leu Ser Leu Leu Leu Met He 
225 2230 2235 2240 

Val Leu He Pro Glu Pro Glu Lys Gin Arg Ser Gin Thr Asp Asn Gin 
2245 2250 2255 

Leu Ala Val Phe Leu He Cys Val Met Thr Leu Val Ser Ala Val Ala 
2260 * 2265 2270 

Ala Asn Glu Met Gly Trp Leu Asp Lys Thr Lys Ser Asp He Ser Ser 
2275 2280 2285 

Leu Phe Gly Gin Arg He Glu Val Lys Glu Asn Phe Ser Met Gly Glu 
2290 2295 2300 

Phe Leu Leu Asp Leu Arg Pro Ala Thr Ala Trp Ser Leu Tyr Ala Val 
305 2310 2315 2320 

Thr Thr Ala Val Leu Thr Pro Leu Leu Lys His Leu He Thr Ser Asp 
2325 2330 2335 

Tyr He Asn Thr Ser Leu Thr Ser He Asn Val Gin Ala Ser Ala Leu 
2340 2345 2350 

Phe Thr Leu Ala Arg Gly Phe Pro Phe Val Asp Val Gly Val Ser Ala 
2355 2360 2365 

Leu Leu Leu Ala Ala Gly Cys Trp Gly Gin Val Thr Leu Thr Val Thr 
2370 2375 2380 

Val Thr Ala Ala Thr Leu Leu Phe Cys His Tyr Ala Tyr Met Val Pro 
385 2390 2395 2400 

Gly Trp Gin Ala Glu Ala Met Arg Ser Ala Gin Arg Arg Thr Ala Ala 



2405 



2410 



2415 



Gly He Met Lys Asn Ala Val Val Asp Gly He Val Ala Thr Asp Val 
2420 2425 2430 
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Pro Glu Leu Glu Arg Thr Thr Pro He Met Gin Lys Lys Val Gly Gin 
2435 2440 2445 

He Met Leu He Leu Val Ser Leu Ala Ala Val Val Val Asn Pro Ser 
2450 2455 2460 

Val Lys Thr Val Arg Glu Ala Gly He Leu He Thr Ala Ala Ala Val 
465 2470 2475 2480 

Thr Leu Trp Glu Asn Gly Ala Ser Ser Val Trp Asn Ala Thr Thr Ala 
2485 2490 2495 

He Gly Leu Cys His He Met Arg Gly Gly Trp Leu Ser Cys Leu Ser 
2500 2505 2510 

lie Thr Trp Thr Leu He Lys Asn Met Glu Lys Pro Gly Leu Lys Arg 
2515 2520 2525 

Gly Gly Ala Lys Gly Arg Thr Leu Gly Glu Val Trp Lys Glu Arg Leu 
2530 2535 2540 

Asn Gin Met Thr Lys Glu Glu Phe Thr Arg Tyr Arg Lys Glu Ala He 
545 2550 2555 2560 

He Glu Val Asp Arg Ser Ala Ala Lys His Ala Arg Lys Glu Gly Asn 
2565 2570 2575 

Val Thr Gly Gly His Ser Val Ser Arg Gly Thr Ala Lys Leu Arg Trp 
2580 2585 2590 

Leu Val Glu Arg Arg Phe Leu Glu Pro Val Gly Lys Val He Asp Leu 
2595 2600 2605 

Gly. Cys Gly Arg Gly Gly Trp Cys Tyr Tyr Met Ala Thr Gin Lys Arg 
2610 2615 2620 

Val Gin Glu Val Arg Gly Tyr Thr Lys Gly Gly Pro Gly His Glu Glu 
625 2630 2635 2640 

Pro Gin Leu Val Gin Ser Tyr Gly Trp Asn He Val Thr Met Lys Ser 
2645 2650 2655 

Gly Val Asp Val Phe Tyr Arg Pro Ser Glu Cys Cys Asp Thr Leu Leu 
2660 2665 2670 

Cys Asp lie Gly Glu Ser Ser Ser Ser Ala Glu Val Glu Glu His Arg 
2675 2680 2685 

Thr lie Arg Val Leu Glu Met Val Glu Asp Trp Leu His Arg Gly Pro 
2690 2695 2700 

Arg Glu Phe Cys Val Lys Val Leu Cys Pro Tyr Met Pro Lys Val He 
705 2710 2715 2720 

Glu Lys Met Glu Leu Leu Gin Arg Arg Tyr Gly Gly Gly Leu Val Arg 



2725 



2730 



2735 



Asn Pro Leu Ser Arg Asn Ser Thr His Glu Met Tyr Trp Val Ser Arg 
2740 2745 " 2750 



PCT 
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Ala Ser Gly Asn Val Val His Ser Val Asn Met Thr Ser Gin Val Leu 
2755 2760 2765 

Leu Gly Arg Met Glu Lys Arg Thr Trp Lys Gly Pro Gin Tyr Glu Glu 
2770 2775 2780 

Asp Val Asn Leu Gly Ser Gly Thr Arg Ala Val Gly Lys Pro Leu Leu 
785 2790 2795 2800 

Asn Ser Asp Thr Ser Lys lie Asn Asn Arg He Glu Arg Leu Arg Arg 
2805 2810 2815 

Glu Tyr Ser Ser Thr Trp His His Asp Glu Asn His Pro Tyr Arg Thr 
2820 2825 2830 

Trp Asn Tyr His Gly Ser Tyr Asp Val Lys Pro Thr Gly Ser Ala Ser 
2835 2840 2845 

Ser Leu Val Asn Gly Val Val Arg Leu Leu Ser Lys Pro Trp Asp Thr 
2850 2855 2860 

He Thr Asn Val Thr Thr Met Ala Met Thr Asp Thr Thr Pro Phe Gly 
865 2870 2875 2880 

Gin Gin Arg Val Phe Lys Glu Lys Val Asp Thr Lys Ala Pro Glu Pro 
2885 2890 2895 

Pro Glu Gly Ala Lys Tyr Val Leu Asn Glu Thr Thr Asn Trp Leu Trp 
2900 2905 2910 

Ala Phe Leu Ala Arg Glu Lys Arg Pro Arg Met Cys Ser Arg Glu Glu 
2915 2920 2925 

Phe He Arg Lys Val Asn Ser Asn Ala Ala Leu Gly Ala Met Phe Glu 
2930 2935 2940 

Glu Gin Asn Gin Trp Arg Ser Ala Arg Glu Ala Val Glu Asp Pro Lys 
945 2950 2955 2960 

Phe Trp Glu Met Val Asp Glu Glu Arg Glu Ala His Leu Arg Gly Glu 
2965 2970 2975 

Cys His Thr Cys He Tyr Asn Met Met Gly Lys Arg Glu Lys Lys Pro 
2980 2985 2990 

Gly Glu Phe Gly Lys Ala Lys Gly Ser Arg Ala He Trp Phe Met Trp 
2995 3000 3005 

Leu Gly Ala Arg Phe Leu Glu Phe Glu Ala Leu Gly Phe Leu Asn Glu 
3010 3015 3020 

Asp His Trp Leu Gly Arg Lys Asn Ser Gly Gly Gly Val Glu Gly Leu 
025 * 3030 3035 3040 

Gly Leu Gin Lys Leu Gly Tyr lie Leu Arg Glu Val Gly Thr Arg Pro 
3045 3050 3055 



Gly Gly Lys He Tyr Ala Asp Asp Thr Ala Gly Trp Asp Thr Arg He 
3060 3065 3070 



# 
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Thr Arg Ala Asp Leu Glu Asn Glu Ala Lys Val Leu Glu Leu Leu Asp 
3075 3080 3085 

Gly Glu His Arg Arg Leu Ala Arg Aia He lie Glu Leu Thr Tyr Arg 
3090 3095 3100 

His Lys Val Val Lys Val Met Arg Pro Ala Ala Asp Gly Arg Thr Val 
105 3110 3115 3120 

Met Asp Val He Ser Arg Glu Asp Gin Arg Gly Ser Gly Gin Val Val 
3125 3130 3135 

Thr Tyr Ala Leu Asn Thr Phe Thr Asn Leu Ala Val Gin Leu Val Arg 
3140 3145 3150 

Met Met Glu Gly Glu Gly Val He Giy Pro Asp Asp Val Glu Lys Leu 
3155 3160 3165 

Thr Lys Gly Lys Gly Pro Lys Val Arg Thr Trp Leu Phe Glu Asn Gly 
3170 3175 3180 

Glu Glu Arg Leu Ser Arg Met Ala Val Ser Gly Asp Asp Cys Val Val 
185 3190 3195 3200 

Lys Pro Leu Asp Asp Arg Phe Ala Thr Ser Leu His Phe Leu Asn Aia 
3205 3210 . 3215 

Met Ser Lys Val Arg Lys Asp He Gin Glu Trp Lys Pro Ser Thr Gly 
3220 3225 3230 

Trp Tyr Asp Trp Gin Gin Val Pro Phe Cys Ser Asn His Phe Thr Glu 
3235 3240 3245 

Leu He Met Lys Asp Gly Arg Thr Leu Val Val Pro Cys Arg Gly Gin 
3250 3255 3260 

Asp Glu Leu Val Gly Arg Ala Arg He Ser Pro Gly Ala Gly Trp Asn 
265 3270 3275 3280 

Val Arg Asp Thr Ala Cys Leu Ala Lys Ser Tyr Ala Gin Met: Trp Leu 
3285 3290 3295 

Leu Leu Tyr Phe His Arg Arg Asp Leu Arg Leu Met Ala Asn Ala He 
3300 3305 3310 

Cys Ser Ala Val Pro Val Asn Trp Val Pro Thr Gly Arg Thr Thr Trp 
3315 3320 3325 

Ser He His Ala Gly Gly Glu Trp Met Thr Thr Glu Asp Met Leu Glu 
3330 3335 3340 

Val Trp Asn Arg Val Trp He Glu Glu Asn Glu Trp Met Glu Asp Lys 
345 3350 3355 3360 

Thr Pro Val Glu Lys Trp Ser Asp Val Pro Tyr Ser Gly Lys Arg Glu 
3365 3370 3375 



Asp He Trp Cys Gly Ser Leu He Gly Thr Arg Ala Arg Ala Thr Trp 
3380 3385 3390 
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Ala Glu Asa lie Gin Val Ala He Asn Gin Val Arg Ala He He Gly 
3395 3400 3405 

Asp Glu Lys Tyr Val Asp Tyr Met Ser Ser Leu Lys Arg Tyr Glu Asp 
3410 3415 3420 



Thr Thr Leu Val Glu Asp Thr Val Leu 
425 3430 



<210> 3 
<4O0> 000 



<210> 4 
<400> 000 



<210> 5 
<211> 19 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 
<400> 5 

gtcagacgct gacctggtg 



<210> 6 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 
<400> 6 

agcttctcct tacacagttg g 



<210> 7 
<211> 19 
<212> ADN 

<213> Sequence artificielle 

<223> Description de la sequence artificielle : amorce 
<400> 7 

acagtgcagg tgtgtgagc 



<210> 8 
<211> 20 
<212> ADN 

<213> Sequence artificielle 



< 
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<223> Description de la sequence art i ficielle : amorce 
<400> 8 

tcatgtctca gaaaggaaac 



<210> 9 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: amorce 
<400> 9 

ctggctgcag aggtaaaagc t 

<210> 10 
<211> 22 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence art if icielle : amorce 
<400> 10 

tcaggacagg gtggagtaga gc 

<210> 11 
<211> 22 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 
<400> 11 

gtaccggacc ctcacccctt gt 



<210> 12 
<211> 22 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 
<400> 12 

gctccatcca tccaaccatc ca 



<210> 13 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
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<220> 

<223> Description de la sequence artif icielle : amorce 
<400> 13 

gagtttgaag tgaggtgttg c 



<210> 14 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielleramorce 
<400> 14 

ttctcttgtg gatgcgttgt g 



<210> 15 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: amorce 
<400> 15 

tgggtatatg cggagcgatg c 



<210> 16 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle : amorce 
<400> 16 

agtcgaacca acccgctgtc a 

<210> 17 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle : amorce 
<400> 17 

actacctcac acggaatcta c 



<210> 18 

<211> 21 

<212> ADN 

<213> Sequence artificielle 




• 1 
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<220> 

<223> Description de la sequence art i ficielle : amorce 
<400> 18 

ttctacgcca atctcatcag t 21 



<210> 19 
<2il> 21 
<212> ADN 

<213> Sequence arcificielle 
<220> 

<223> Description cie la sequence art ificielle : amorce 
<400> 19 

acacagtgtc catctcaacc a 21 



<210> 20 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 
<400> 20 

aaccactggt caaggttctg c 21 



<210> 21 
<211> 23 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 
<400> 21 

acaaccacgt ccataagtct ctg 23 



<210> 22 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 
<400> 22 

gcctttctct tctcagtgta a 21 



<210> 23 
<211> 1412 
<212> ADN 

<213> Mus musculus 
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<220> 
<221> CDS 
<222> (36).. (1139) 

<400> 23 

ccaggctggg agacccagga agctccagac ttagc atg gag cac gga etc agg 53 

Met Glu His Gly Leu Arg 
1 5 



age ate cca gee tgg acg ctg gac aag ttc ata gag gat tac etc ctt 101 
Ser lie Pro Ala Trp Thr Leu Asp Lys Phe He Glu Asp Tyr Leu Leu 
10 15 20 

ccc gac acc acc ttt ggt get gat gtc aaa tea gee gtc aat gtc gtg 149 
Pro Asp Thr Thr Phe Gly Ala Asp Val Lys Ser Ala Val Asn Val Val 
25 30 35 

tgt gat ttc ctg aag gag aga tgc ttc caa ggt get gee cac cca gtg 197 
Cys Asp Phe Leu Lys Glu Arg Cys Phe Gin Gly Ala Ala Hi:- Pro Val 
40 45 50 

agg gtc tec aag gtg gtg aag ggt ggc tec tea ggc aaa ggc acc aca 24 5 
Arg Val Ser Lys Val Val Lys Gly Gly Ser Ser Gly Lys Gly Thr Thr 
55 60 65 70 

etc aag ggc agg tea gac get gac ctg gtg gtg ttc ctt aac aat etc 293 
Leu Lys Gly Arg Ser Asp Ala Asp Leu Val Val Phe Leu Asn Asn Leu 
75 80 85 

acc age ttt gag gat cag tea aac cga egg gga gag ttc ate aag gaa 341 
Thr Ser Phe Glu Asp Gin Leu Asn Arg Arg Gly Glu Phe He Lys Glu 
90 95 100 

att aag aaa cag ctg tac gag gtt cag cat gag aga cgt ttt aga .gtc 389 
He Lys Lys Gin Leu Tyr Glu Val Gin His Glu Arg Arg Phe Arg Val 
105 110 115 

aag ttt gag gtc cag agt tea tgg tgg ccc aac gec egg tct ctg age 437 
Lys Phe Glu Val Gin Ser Ser Trp Trp Pro Asn Ala Arg Ser Leu Ser 
120 125 ' 130 

ttc aag ctg age gee ccc cat ctg cat cag gag gtg gag ttt gat gtg 485 
Phe Lys Leu Ser Ala Pro His Leu His Gin Glu Val Glu Phe Asp Val 
135 140 145 * 150 

ctg cca gee ttt gat gtc ctg ggt cat gtt aat act tec age aag cct 533 
Leu Pro Ala Phe Asp Val Leu Gly His Val Asn Thr Ser Ser Lys Pro 
155 160 165 

gat ccc aga ate tat gee ate etc ate gag gaa tgt acc tec ctg ggg 581 
Asp Pro Arg He Tyr Ala He Leu He Glu Glu Cys Thr Ser Leu Gly 
170 175 180 

aag gat ggc gag ttc tct acc tgc ttc acg gag etc cag egg aac ttc 629 
Lys Asp Gly Glu Phe Ser Thr Cys Phe Thr Glu Leu Gin Arg Asn Phe 
185 190 195 



ctg aag cag cgc cca acc aag ctg aag agt etc ate cgc ctg gtc aag 
Leu Lys Gin Arg Pro Thr Lys Leu Lys Ser Leu He Arg Leu Val Lys 
200 205 210 



677 
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cac tgg tac caa ctg tgt aag gag aag ctg ggg aag cca ttg cct cca 
His Trp Tyr Gin Leu Cys Lys Glu Lys Leu Gly Lys Pro Leu Pro Pro 
215 220 225 230 



725 



cag tac gcc eta gag ttg etc act gtc ttt gec tgg gaa caa ggg aat 
Gin Tyr Ala Leu Glu Leu Leu Thr Val ?he Ala Trp Glu Gin Gly Asn 
235 240 245 



773 



gga tgt tat gag ttc aac aca gcc cag ggc ttc egg acc gtc ttg gaa 821 
Gly Cys Tyr Glu Phe Asn Thr Ala Gin Gly Phe Arg Thr Val Leu Glu 
250 255 260 



ctg gtc ate aat tat cag cat ctt cga ate tac tgg aca aag tat tat 
Leu Val He Asn Tyr Gin His Leu Arg He Tyr Trp Thr Lys Tyr Tyr 
265 270 275 



869 



gac ttt caa cac cag gag gtc tec aaa tac ctg cac aga cag etc aga 
Asp Phe Gin His Gin Glu Val Ser Lys Tyr Leu His Arg Gin Leu Arg 
280 285 29a 



917 



aaa gcc agg cct gtg ate ctg gac cca get gac cca aca ggg aat gtg 
Lys Ala Arg Pro Val He Leu Asp Pro Ala Asp Pro Thr Gly Asn Val 
295 300 305 310 



965 



gcc ggt ggg aac cca gag ggc tgg agg egg ttg get gaa gag get gat 
Ala Gly Gly Asn Pro Glu Gly Trp Arg Arg Leu Ala Glu Glu Ala Asp 
315 320 325 



1013 



gtg tgg eta tgg tac cca tgt ttt att aaa aag gat ggt tec cga gtg 
Val Trp Leu Trp Tyr Pro Cys Phe He Lys Lys Asp Gly Ser Arg Val 
330 335 340 



1061 



age tec tgg gat gtg ccg acg gtg gtt cct gta cct ttt gag cag gta 
Ser. Ser Trp Asp Val Pro Thr Val Val Pro Val Pro Phe Glu Gin Val 
345 350 355 



1109 



gaa gag aac tgg aca tgt ate ctg ctg tga gcacagcagc acctgcccag 
Glu Glu Asn Trp Thr Cys He Leu Leu 



1159 



360 




365 








gagactgetg 


gtcaggggca 


tttgetgetc 


tgetgeagge ccatgaccca 


gtgagggagg 


1219 


gccccacctg 


gcatcagact 


ccgtgcttct 


gatgcctgcc agccatgttt 


gactcctgtc 


1279 


caatcacagc 


cagccttcct 


caacagattc 


agaaggagag gaaagaacac 


acgcttggtg 


1339 


tccatctgtc 


cacctgttgg 


aaggttctgt 


ctgacaaagt ctgatcaaca 


ataaaccaca 


1399 


gcaggtgccg 


tea 








1412 



<210> 24 
<211> 367 
<212> PRT 

<213> Mus musculus 



<400> 24 

Met Glu His Gly Leu Arg Ser He Pro Ala Trp Thr Leu Asp Lys Phe 
15 10 15 
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lie Glu Asp Tyr Leu Leu Pro Asp Thr Thr Phe Gly Ala Asp Vai Lys 
20 25 30 

Ser Ala Val Asn Val Val Cys Asp Phe Leu Lys Glu Arg Cys Phe Gin 
35 40 45 

Gly Ala Ala His Pro Val Arg Val Ser Lys Val Val Lys Gly Gly Ser 
50 55 60 

Ser Gly Lys Gly Thr Thr Leu Lys Gly Arg Ser Asp Ala Asp Leu Val 
65 70 75 80 

Val Phe Leu Asn Asn Leu Thr Ser Phe Glu Asp Gin Leu Asn Arg Arg 
85 90 95 

Gly Glu Phe He Lys Glu He Lys Lys Gin Leu Tyr Glu Val Gin His 
100 105 110 

Glu Arg Arg Phe Arg Val Lys Phe Glu Val Gin Ser Ser Trp Trp Pro 
115 120 125 

Asn Ala Arg Ser Leu Ser Phe Lys Leu Ser Ala Pro His Leu His Gin 
130 135 " 140 

Glu Val Glu Phe Asp Val Leu Pro Ala Phe Asp Val Leu Gly His Val 
145 150 155 160 

Asn Thr Ser Ser Lys Pro Asp Pro Arg He Tyr Ala He Leu He Glu 
165 170 175 

Glu Cys Thr Ser Leu Gly Lys Asp Gly Glu Phe Ser Thr Cys Phe Thr 
180 185 190 

Glu Leu Gin Arg Asn Phe Leu Lys Gin Arg Pro Thr Lys Leu Lys Ser 
195 200 205 

Leu He Arg Leu Val Lys His Trp Tyr Gin Leu Cys Lys Glu Lys Leu 
210 215 220 

Gly Lys Pro Leu Pro Pro Gin Tyr Ala Leu Glu Leu Leu Thr Val Phe 
225 230 235 240 

Ala Trp Glu Gin Gly Asn Gly Cys Tyr Glu Phe Asn Thr Ala Gin Gly 
245 250 255 

Phe Arg Thr Val Leu Glu Leu Val He Asn Tyr Gin His Leu Arg He 
260 265 270 

Tyr Trp Thr Lys Tyr Tyr Asp Phe Gin His Gin Glu Vai Ser Lys Tyr 
275 280 285 

Leu His Arg Gin Leu Arg Lys Ala Arg Pro Val He Leu Asp Pro Ala 
290 295 300 

Asp Pro Thr Gly Asn Val Ala Gly Gly Asn Pro Glu Gly Trp Arg Arg 
305 310 315 320 



Leu Ala Glu Glu Ala Asp Val Trp Leu Trp Tyr Pro Cys Phe He Lys 
325 330 335 
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Lys Asp Gly Ser Arg Val Ser Ser Tro Asp Val Pro Thr Val Val Pro 
340 345 350 

Val Pro Phe Glu Gin Val Glu Glu Asn Trp Thr Cys He Leu Leu 
355 360 365 



<210> 25 
<211> 1413 
<212> ADN 

<213> Mus musculus 

<220> 
<221> CDS 

<222> (36) . . (1139) 



<400> 25 

ccaggctggg agacccagga agctccagac ttagc atg gag cac gga etc agg 53 

Met Glu His Gly Leu Arg 
1 5 



age ate 
Ser He 


cca 
Pro 


gee 
Ala 
10, 


tgg 
Trp 


acg 
Thr 


ctg 
Leu 


gac 
Asp 


aag 
Lys 
15 


ttc 
Phe 


ata gag gat tac 
He Glu Asp Tyr 
20 


etc 
Leu 


ctt 
Leu 


101 


ccc gac 
Pro Asp 


acc 
Thr 
25 


acc 
Thr 


ttt 
Phe 


ggt 
Gly 


get 
Ala 


gat 
Asp 
30 


gtc 
Val 


aaa 
Lys 


tea gee gtc 
Ser Ala Val 
35 


aat 
Asn 


gtc gtg 
Val Val 


149 


tgt gat 
Cys Asp 
40 


ttc 
Phe 


ctg 
Leu 


aag 
Lys 


gag 
Glu 


aga 
Arg 
45 


tgc 
Cys 


ttc caa ggt get gee 
Phe Gin Gly Ala Ala 
50 


cac 
His 


cca 
Pro 


gtg 
Val 


197 


agg gtc 
Arg Val 
55 


tec 
Ser 


aag 
Lys 


gtg 
Val 


gtg 
Val 
60 


aag 
Lys 


ggt 
Gly 


ggc tec 
Gly Ser 


tea ggc aaa 
Ser Gly Lys 
65 


ggc acc 
Gly Thr 


aca 
Thr 
70 


245 


etc aag 
Leu Lys 


ggc agg tea 
Gly Arg Ser 
75 


gac 
Asp 


get 
Ala 


gac 
Asp 


ctg 
Leu 


gtg 
Val 
80 


gtg ttc ctt 
Val Phe Leu 


aac 
Asn 


aat 
Asn 
85 


etc 
Leu 


293 


ace age 
Thr Ser 


ttt 
Phe 


gag 
Glu 
90 


gat 
Asp 


cag 
Gin 


tta 
Leu 


aac 
Asn 


cga egg 
Arg Arg 
95 


gga gag ttc 
Gly Glu Phe 


ate aag 
He Lys 
100 


gaa 
Glu 


341 


att aag 
He Lys 


aaa 
Lys 
105 


cag 
Gin 


ctg 
Leu 


tac 
Tyr . 


gag 
Glu 


gtt 
Val 
110 


cag 
Gin 


cat 
His 


gag -aga cgt 
Glu Arg Arg 
115 


ttt 
Phe 


aga 
Arg 


gtc 
Val 


389 


aag ttt 
Lys Phe 
120 


gag 
Glu 


gtc 
Val 


cag 
Gin 


agt 
Ser 


tea 
Ser 
125 


tgg 
Trp 


tgg 
Trp 


ccc aac gee egg 
Pro Asn Ala Arg 
130 


tct 
Ser 


ctg 
Leu 


age 
Ser 


437 



ttc aag ctg age gee ccc cat ctg cat cag gag gtg gag ttt gat gtg 485 
Phe Lys Leu Ser Ala Pro His Leu His Gin Glu Val Glu Phe Asp Val 
135 140 145 150 
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ctg cca gcc ttt gat gtc ctg ggt cat gtt aat act tec age aag cct 533 

Leu Pro Ala Phe Aso Val Leu Gly His Val Asn Thr Ser Ser Lys Pro 
15*5 160 165 

gat ccc aga ate tat gcc ate etc ate gag gaa tgt acc tec ctg ggg 581 

Asp Pro Arg lie Tyr Ala lie Leu lie Glu Giu Cys Thr Ser Leu Gly 
170 175 180 

aag gat ggc gag ttc tct acc tgc ttc acg gag etc cag egg aac ttc 629 

Lys Asp Gly Glu Phe Ser Thr Cys Phe Thr Glu Leu Gin Arg Asn Phe 

185 190 195 



/Ff^^ 



ctg aag cag cgc cca acc aag ctg aag agt etc ate cgc ctcj gtc aag 677 
Leu Lys Gin Arg Pro Thr Lys Leu Lys Ser Leu He Arg Leu Val Lys 
200 205 210 

cac tgg tac caa ctg tgt aag gag aag ctg ggg aag cca ttg cct cca 725 
His Trp Tyr Gin Leu Cys Lys Glu Lys Leu Gly Lys Pro Leu Pro Pro 
215 220 225 230 

cag tac gcc eta gag ttg etc act gtc ttt gcc tgg gaa caa ggg aat 773 
Gin Tyr Ala Leu Glu Leu Leu Thr Val Phe Ala Trp Glu Gin Gly Asn 
235 240 245 

gga tgt tat gag ttc aac aca gcc cag ggc ttc egg acc gtc ttg gaa 821 
Gly Cys Tyr Glu Phe Asn Thr Ala Gin Gly Phe Arg Thr Val Leu Glu 
250 255 260 

ctg gtc ate aat tat cag cat ctt cga ate tac tgg aca aag tat tat 869 
Leu Val He Asn Tyr Gin His Leu Arg He Tyr Trp Thr Lys Tyr Tyr 
265 270 275 

gac ttt caa cac cag gag gtc tec aaa tac ctg cac aga cag etc aga 917 
Asp Phe Gin His Gin Glu Val Ser Lys Tyr Leu His Arg Gin Leu Arg 
280 285 290 

aaa gcc agg cct gtg ate ctg gac cca get gac cca aca ggg aat gtg 965 
Lys Ala Arg Pro Val He Leu Asp Pro Ala Asp Pro Thr Gly Asn Val 
295 300 305 310 

gcc ggt ggg aac cca gag ggc tgg agg egg ttg get gaa gag get gat 1013 
Ala Gly Gly Asn Pro Glu Gly Trp Arg Arg Leu Ala Glu Glu Ala Asp 
315 320 325 

gtg tgg eta tgg tac cca tgt ttt att aaa aag gat ggt tec cga gtg 1061 
Val Trp Leu Trp Tyr Pro Cys Phe He Lys Lys Asp Gly Ser Arg Val 
330 335 340 

age tec tgg gat gtg ccg acg gtg gtt cct gta cct ttt gag cag gta 1109 
Ser Ser Trp Asp Val Pro Thr Val Val Pro Val Pro Phe Glu Gin Val 
345 350 355 

gaa gag aac tgg aca tgt ate ctg ctg tga gcacagcagc acctgcccag 1159 
Glu Glu Asn Trp Thr Cys lie Leu Leu 
360 365 

gagactgetg gtcaggggca tttgetgetc tgetgeagge ccatgaccca gtgagggagg 1219 

gccccacctg gcatcagact ccgtgcttct gatgcctgcc agccatgttt gactcctgtc 1279 
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caatcacagc cagccttcct caacagattc agaaggagag gaaagaacac acgcttggtg 1339 
tccatctgtc cacctgttgg aaggttctgt ctgacaaagt ctgatcaaca ataaaccaca 1399 



<210> 26 

<211> 367 

<212> PRT 

<213> Mus musculus 

<400> 26 

Met Glu His Gly Leu Arg Ser lie Pro Ala Trp Thr Leu Asp Lys Phe 
15 10 15 

He Glu Asp Tyr Leu Leu Pro Asp Thr Thr Phe Gly Ala Asp Val Lys 
20 25 30 

Ser Ala Val Asn Val Val Cys Asp Phe Leu Lys Glu Arg Cys Phe Gin 
35 40 45 

Gly Ala Ala His Pro Val Arg Val Ser Lys Val Val Lys Gly Gly Ser 
50 55 60 

Ser Gly Lys Gly Thr Thr Leu Lys Gly Arg Ser Asp Ala Asp Leu Val 
65 ^ ~ 70 75 80 

Val Phe Leu Asn Asn Leu Thr Ser Phe Glu Asp Gin Leu Asn Arg Arg 
85 ■ 90 95 

Gly Glu Phe He Lys Glu He Lys Lys Gin Leu Tyr Glu Val Gin His 
100 " 105 110 

Glu Arg Arg Phe Arg Val Lys Phe Glu Val Gin Ser Ser Trp Trp Pro 
115 120 125 

Asn Ala Arg Ser Leu Ser Phe Lys Leu Ser Ala Pro His Leu His Gin 
130 135 140 

Glu Val Glu Phe Asp Val Leu Pro Ala Phe Asp Val Leu Gly His Val 
145 150 155 160 

Asn Thr Ser Ser Lys Pro Asp Pro Arg He Tyr Ala He Leu He Glu 
165 170 ~ 175 

Glu Cys Thr Ser Leu Gly Lys Asp Gly Glu Phe Ser Thr Cys Phe Thr 
180 185 190 

Glu Leu Gin Arg Asn Phe Leu Lys Gin Arg Pro Thr Lys Leu Lys Ser 
195 200 205 

Leu He Arg Leu Val Lys His Trp Tyr Gin Leu Cys Lys Glu Lys Leu 
210 ' 215 220 

Gly Lys Pro Leu Pro Pro Gin Tyr Ala Leu Glu Leu Leu Thr Val Phe 
225 * 230 235 240 



gcaggtgccc 



gtca 



1413 



Ala Trp Glu Gin Gly Asn Gly Cys Tyr Glu Phe Asn Thr Ala Gin Gly 
245 250 255 
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Phe Arg Thr Val Leu Glu Leu Val 
260 

Tyr Trp Thr Lys Tyr Tyr Asp Phe 

275 280 

Leu His Arg Gin Leu Arg Lys Ala 
290 " 295 

Asp Pro Thr Gly Asn Val Ala Gly 
305 310 

Leu Ala Glu Glu Ala Asp Val Trp 
325 

Lys Asp Gly Ser Arg Val Ser Ser 
34 0 

Val Pro Phe Glu Gin Val Glu Glu 
355 360 



lie Asn Tyr Gin His Leu Arg lie 
265 270 

Gin His Gin Glu Val Ser Lys Tyr 
285 

Arg Pro Val lie Leu Asp Pro Ala 
300 

Gly Asn Pro Glu Gly Trp Arg Arg 
315 320 

Leu Trp Tyr Pro Cys Phe lie Lys 
330 335 

Trp Asp Val Pro Thr Val Val Pro 
345 350 

Asn Trp Thr Cys lie Leu Leu 
365 



<210> 27 
<211> 902 
<212> ADN 

<213> Mus musculus 

<220> 

<221> CDS 

<222> (36) . . (791) 

<400> 27 

acctgctggc tgcagaggta aaagctggac ctagg at;g gag cag gat ctg agg 53 

Met Glu Gin Asp Leu Arg 
1 5 

age ate ccg gec teg aag ctt gat aag ttc ata gag aac cat etc ccg 101 
Ser lie Pro Ala Ser Lys Leu Asp Lys Phe lie Glu Asn His Leu Pro 
' 10 15 20 

gac ace age ttc tgt get gac etc aga gaa gtc ata gat gee ctg tgt 149 
Asp Thr Ser Phe Cys Ala Asp Leu Arg Glu Val lie Asp Ala Leu Cys 
25 30 35 

get etc ctg aag gac aga tec ttc egg ggc ccc gtc cgc cga atg agg 197 
Ala Leu Leu Lys Asp Arg Ser Phe Arg Gly Pro Val Arg Arg Met Arg 
40 45 50 

gee tct aaa ggg gtc aag ggc aaa ggc ace gcg etc aag ggc agg tea 245 
Ala Ser Lys Gly Val Lys Gly Lys Gly Thr Ala Leu Lys Gly Arg Ser 
55 ' J 60- 65 70 

gac get gac ctg gtg gtg ttc ctt aac aat etc ace age ttt gag gat 293 
Asp Ala Asp Leu Val Val Phe Leu Asn Asn Leu Thr Ser Phe Glu Asp 
75 80 85 



cag tta aac caa cag gga gtg ttg act aag gaa att aag aaa cag ctg 
Gin Leu Asn Gin Gin Gly Val Leu lie Lys Glu lie Lys Lys Gin Leu 
90 ' 95 100 



341 
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tgc gag gtt cag cat gag aga cgc tgt gga gtg aag cct gag gtc cac 389 
Cys Glu Val Gin His Glu Arg Arg Cys Gly Val Lys Phe Glu Val His 
105 110 115 

agt tta agg agt ccc aac tec egg get ctg age ttc aag ctg age gee 437 
Ser Leu Arg Ser Pro Asn Ser Arg Ala Leu Ser Phe Lys Leu Ser Ala 
120 125 130 

ccc gac ctg ctg aag gag gtg aag ttt gat gtg ctg cca gec tat gat 485 
Pro Asp Leu Leu Lys Glu Val Lys Phe Asp Val Leu Pro Ala Tyr Asp 
135 140 145 150 

tta ctg gat cat ctt aac ate etc aag aag cct aac caa caa ttc tac 533 
Leu Leu Asp His Leu Asn lie Leu Lys Lys Pro Asn Gin Gin Phe Tyr 
155 * 160 165 

gec aat etc ate agt ggc gta ccc gee ggg aag gag ggc aag tta teg 581 
Ala Asn Leu He Ser Gly Val Pro Ala Gly Lys Glu Gly Lys Leu Ser 
170 175 180 

ate tgc ttt atg ggg ctt cag aag tac ttc ctg aac tgt cgc cca ace 629 
He Cys Phe Met Gly Leu Gin Lys Tyr Phe Leu Asn Cys Arg Pro Thr 
185 190 195 

aag ctg aag cgc etc ate cgc ctg gtc acg cac tgg tac caa ctg tgt 677 
Lys Leu Lys Arg Leu He Arg Leu Val Thr His Trp Tyr Gin Leu Cys 
200 205 210 

aag gag aag ctg ggg gac ccg ctg ccc cca cag tat gee ctg gag ctg 725 
Lys Glu Lys Leu Gly Asp Pro Leu Pro Pro Gin Tyr Ala Leu Glu Leu 
215 * 220 225 ' 230 

etc aca etc gat gec tgg gag tat ggg agt cga gta act aaa ttc aac 773 
Leu Thr Leu Asp Ala Trp Glu Tyr Gly Ser Arg Val Thr Lys Phe Asn 
235 240 245 

aca gee cag ggc ttc tga acegtcttgg aactggtcac caagtacaaa 821 
Thr Ala Gin Gly Phe 
250 

cagcttcaaa tctactggac agtgtattat gactttcaac accaggaggt ctccaaatac 881 
ctgcacagac agctcagaaa a 902 



<210> 28 
<211> 251 
<212> PRT 

<213> Mus musculus 
<400> 28 

Met Glu Gin Asp Leu Arg Ser lie Pro Ala Ser Lys Leu Asp Lys Phe 
15 10 15 

He Glu Asn His Leu Pro Asp Thr Ser Phe Cys Ala Asp Leu Arg Glu 
20 25 30 



Val He Asp Ala Leu Cys Ala Leu Leu Lys Asp Arg Ser Phe Arg Gly 
35 40 * 45 



• 1 
PCT/FflP 
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Pro Val Arg Arg Met Arg Ala Ser Lys Gly Val Lys Gly Lys Gly Thr 
50 55 60 

Ala Leu Lys Gly Arg Ser Asp Ala Asp Leu Val Val ?he Leu Asn Asn 
65 ' 70 75 80 

Leu Thr Ser Phe Glu Asp Gin Leu Asn Gin Gin Gly Val Leu lie Lys 
85 90 95 

Glu He Lys Lys Gin Leu Cys Glu Val Gin Kis Glu Arg Arg Cys Gly 
100 105 110 

Val Lys Phe Glu Val His Ser Leu Arg Ser Pro Asn Ser Arg Ala Leu 
115 120 125 

Ser Phe Lys Leu Ser Ala Pro Asp Leu Leu Lys Glu Val Lys Phe Asp 
130 135 140 

Val Leu Pro Ala Tyr Asp Leu Leu Asp His Leu Asn He Leu Lys Lys 
145 ' 150 155 • 160 

Pro Asn Gin Gin Phe Tyr Ala Asn Leu lie Ser Gly Val Pro Ala Gly 
165 170 175 

Lys Glu Gly Lys Leu Ser He Cys Phe Met Gly Leu Gin Lys Tyr Phe 
180 185 190 

Leu Asn Cys Arg Pro Thr Lys Leu Lys Arg Leu He Arg Leu Val Thr 
195 200 205 

His Trp Tyr Gin Leu Cys Lys Glu Lys Leu Gly Asp Pro Leu Pro Pro 
210 J 215 220 

Gin Tyr Ala Leu Glu Leu Leu Thr Leu Asp Ala Trp Glu Tyr Gly Ser 
225 230 235 240 

Arg Val Thr Lys Phe Asn Thr Ala Gin Gly Phe 
245 250 



<210> 29 
<211> 1322 
<212> ADN 

<213> Homo sapiens 

<220> 
<221> CDS 

<222> (34) . . (1128) 
<400> 29 

gaggcagttc tgttgccact ctctctcctg tea atg atg gat etc aga aat acc 54 

Met Met Asp Leu Arg Asn Thr 
1 5 



cca gec aaa tct ctg gac aag ttc att gaa gac tat etc ttg cca gac 102 
Pro Ala Lys Ser Leu Asp Lys Phe He Glu Asp Tyr Leu Leu Pro Asp 
10 15 20 



* 
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acg tgt tec cgc atg caa ate aac cat gec att gac ate ate tgt ggg 150 
Thr Cys Phe Arg Met Gin lie Asn His Ala He Asp He He Cys Gly 
25 30 35 

ttc ctg aag gaa agg tgc ttc cga ggt age tec tac cct gtg tgt gtg 198 
Phe Leu Lys Glu Arg Cys Phe Arg Gly Ser Ser Tyr Pro Val Cys Val 
40 " 45 50 55 

tec aag gtg gta aag ggt ggc tec tea ggc aag -ggc acc ace etc aga 24 6 
Ser Lys Val Val Lys Gly Gly Ser Ser Gly Lys Gly Thr Thr Leu Arg 
60 65 70 

ggc cga tct gac get gac ctg gtt gtc ttc etc agt cct etc acc act 294 
Gly Arg Ser Asp Ala Asp Leu Val Val Phe Leu Ser Pro Leu Thr Thr 
75 80 85 

ttt cag gat cag tta aat cgc egg gga gag ttc ate cag gaa att agg 342 
Phe Gin Asp Gin Leu Asn Arg Arg Gly Glu Phe He Gin Glu He Arg 
90 95 100 

aga cag ctg gaa gee tgt caa aga gag aga gca ttt tec gtg aag ttt 390 
Arg Gin Leu Glu Ala Cys Gin Arg Glu Arg Ala Phe Ser Val Lys Phe 
105 HO 115 

gag gtc cag get cca cgc tgg ggc aac ccc cgt gcg etc age ttc gta 438 
Glu Val Gin Ala Pro Arg Trp Gly Asn Pro Arg Ala Leu Ser Phe Val 
120 125 130 135 

ctg agt teg etc cag etc ggg gag ggg gtg gag ttc gat gtg ctg cct 486 
Leu Ser Ser Leu Gin Leu Gly Glu Gly Val Glu Phe Asp Val Leu Pro 
140 145 150 

gee ttt gat gee ctg ggt cag ttg act ggc age tat aaa cct aac ccc 534 
Ala Phe Asp Ala Leu Gly Gin Leu Thr Gly Ser Tyr Lys Pro Asn Pro 
155 160 165 

caa ate tat gtc aag etc ate gag gag tgc acc gac ctg cag aaa gag 582 
Gin He Tyr Val Lys Leu He Glu Glu Cys Thr Asp Leu Gin Lys Glu 
170 175 180 

ggc gag ttc tec acc tgc ttc aca gaa eta cag aga gac ttc ctg aag 630 
Gly Glu Phe Ser Thr Cys Phe Thr Glu Leu Gin Arg Asp Phe Leu Lys 
185 190 195 

cag cgc ccc acc aag etc aag age etc ate cgc eta gtc aag cac tgg 678 
Gin Arg Pro Thr Lys Leu Lys Ser Leu He Arg Leu Val Lys His Trp 
200 " 205 210 215 

tac caa aat tgt aag aag aag ctt ggg aag ctg cca cct cag tat gee 726 
Tyr Gin Asn Cys Lys Lys Lys Leu Gly Lys Leu Pro Pro Gin Tyr' Ala 
220 225 230 

ctg gag etc ctg acg gtc tat get tgg gag cga ggg age atg aaa aca 774 
Leu Glu Leu Leu Thr Val Tyr Ala Trp Glu Arg Gly Ser Met Lys Thr 
235 240 245 

cat ttc aac aca gee cag gga ttt egg acg gtc ttg gaa tta gtc ata 822 
His Phe Asn Thr Ala Gin Gly Phe Arg Thr Val Leu Glu Leu Val He 
250 255 260 
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aac tac cag caa etc tgc acc tac tgg aca aag tat tat gae ttt aaa 870 
Asn Tyr Gin Gin Leu Cys lie Tyr Trp Thr Lys Tyr Tyr Asp Phe Lys 
265 270 275 

aac ccc att att gaa aag tac ccg aga agg cag etc acg aaa ccc acg 918 
Asn Pro lie He Glu Lys Tyr Leu Arg Arg Gin Leu Thr Lys Pro Thr 
280 285 290 295 

cct gtg ate ctg gac ccg gcg gac cct aca gga aac ttg ggt ggt gga 966 
Pro Val He Leu Asp Pro Ala Asp Pro Thr Gly Asn Leu Gly Gly Gly 
300 305 310 

gac cca aag cgt tgg agg cag ctg gca caa gag get gag gec tgg ctg 1014 
Asd Pro Lys Arg Trp Arg Gin Leu Ala Gin Glu Ala Glu Ala Trp Leu 
315 320 325 

aat tac cca tgc ttt aag aat tgg gat ggg tec cca gtg age tec tgg 1062 
Asn Tyr Pro Cys Phe Lys Asn Trp Asp Gly Ser Pro Val Ser Ser Trp 
330 335 340 

att ctg ctg gtg aga cct cct get tec tec ctg cca ttc ate cct gee 1110 
He Leu Leu Val Arg Pro Pro Ala Ser Ser Leu Pro Phe He Pro Ala 
345 350 355 

cct etc cat gaa get tga gacatatagc tggagaccat tctttccaaa 1158 
Pro Leu His Glu Ala 
360 365 

gaacttacct ettgecaaag gecatttata ttcatatagt gacaggctgt gctccatatt 1218 

ttacagtcat tttggtcaca atcgagggtt tctggaattt tcacatccct tgtccagaat 1278 

tcattcccct aagagtaata ataaataacc tctaacacca aaaa 1322 



<210> 30 
<211> 364 
<212> PRT 

<213> Homo sapiens 
<400> 30 

Met Met Asp Leu Arg Asn Thr Pro Ala Lys Ser Leu Asp Lys Phe He 
15 10 15 

Glu Asp Tyr Leu Leu Pro Asp Thr Cys Phe Arg Met Gin He Asn His 
20 25 " 30 

Ala He Asp He lie Cys Gly Phe Leu Lys Glu Arg Cys Phe Arg Gly 
35 40 * 45 

Ser Ser Tyr Pro Val Cys Val Ser Lys Val Val Lys Gly Gly Ser Ser 
50 55 60 

Gly Lys Gly Thr Thr Leu Arg Gly Arg Ser Asp Ala Asp Leu Val Val 
65 70 75 80 

Phe Leu Ser Pro Leu Thr Thr Phe Gin Asp Gin Leu Asn Arg Arg Gly 
85 90 95 



Glu Phe He Gin Glu He Arg Arg Gin Leu Glu Ala Cys Gin Arg Glu 
100 105 110 
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Arg Ala Phe Ser Val Lys Phe Glu Val Gin Ala Pro Arg Trp Gly Asn 
115 120 125 

Pro Arg Ala Leu Ser Phe Val Leu Ser Ser Leu Gin Leu Gly Glu Gly 
130 135 140 

Val Glu Phe Asp Val Leu Pro Ala Phe Asp Ala Leu Gly Gin Leu Thr 
145 * 150 155" 160 

Gly Ser Tyr Lys Pro Asn Pro Gin lie Tyr Val Lys Leu lie Glu Glu 
165 170 175 

Cys Thr Asp Leu Gin Lys Glu Gly Glu Phe Ser Thr Cys Phe Thr Glu 
180 185 190 

Leu Gin Arg Asp Phe Leu Lys Gin Arg Pro Thr Lys Leu Lys Ser Leu 
195 200 205 

lie Arg Leu Val Lys Kis Trp Tyr Gin Asn Cys Lys Lys Lys Leu Gly 
210 215 220 

Lys Leu Pro Pro Gin Tyr Ala Leu Glu Leu Leu Thr Val Tyr Ala Trp 
225 230 235 240 

Glu Arg Gly Ser Met Lvs Thr His Phe Asn Thr Ala Gin Gly Phe Arg 
245 " 250 255 

Thr Val Leu Glu Leu Val lie Asn Tyr Gin Gin Leu Cys lie Tyr Trp 
260 265 270 

Thr Lys Tyr Tyr Asp Phe Lys Asn Pro lie He Glu Lys Tyr Leu Arg 
275 280 285 

Arg Gin Leu Thr Lys Pro Thr Pro Val He Leu Asp Pro Ala Asp Pro 
290 295 300 

Thr Gly Asn Leu Gly Gly Gly Asp Pro Lys Arg Trp Arg Gin Leu Ala 
305 310 315 320 

Gin Glu Ala Glu Ala Trp Leu Asn Tyr Pro Cys Phe Lys Asn Trp Asp 
325 330 ' 335 

Gly Ser Pro Val Ser Ser Trp lie Leu Leu Val Arg Pro Pro Ala Ser 
340 345 350 



Ser Leu Pro Phe He Pro Ala Pro Leu His Glu Ala 
355 360 



<210> 31 

<211> 450 

<212> ADN 

<213> Sequence artificielle 



<220> 

<223> Description de la sequence artificielle : sonde 
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